Deepseek、Zhipu 和 MiniMax 联合发布新版本

国内大规模人工智能模型的重磅新闻接连出现。 2月11日晚，智浦官方确认，在全球模型服务平台OpenRouter最受欢迎车型排行榜上名列前茅的神秘“小马阿尔法”车型，就是智浦GLM-5的全新车型。新模型现已上线chat.z.ai平台。 2月6日，全球模型服务平台OpenRouter悄然发布了代号“Pony Alpha”的匿名模型。凭借其强大的编码能力、超长的上下文窗口以及全面的代理工作流程优化，它迅速引起了开发者社区的关注，并迅速在国外社区流行起来。 OpenRouter官方将Pony Alpha描述为“下一代基础模型”，在角色调度、代理工作流程、推理和游戏操作系统方面具有强大的性能，特别注重“极高的工具调用准确性”。此功能为 AI 代理提供了重要的好处应用场景。开发人员可以通过 Claude Code 等工具调用模型，从而能够在数小时内开发复杂的项目。 1月8日，智浦在香港联交所正式挂牌上市。上市当天，公司首席科学家、清华大学计算机系教授唐杰向全体员工发出内部信，确认新一代基础模型GLM-5“即将推出”，并宣布从2026年开始“大规模回归基础模型研究”，成立专注于架构、学习范式和持续进化三大方向的前沿创新部门X-Lab。此外，DeepSeek还更新了其modeit。报道称，一些用户报告称 DeepSeek 在网络和应用程序中进行了更新，以支持高达 100 万（百万）个令牌的上下文长度。去年8月发布的DeepSeekV3.1的上下文长度已扩展到128K。当前ly，很少有模型可以将上下文带到百万级别。 Google 的 Gemini 系列和 Anthropic 的 Claude Opus 4.6 在实现这一目标方面处于领先地位。 DeepSeek的V系列机型定位为入门机型，追求整体性能的极致。 2024 年 12 月发布的 V3 基础模型是 DeepSeek 的一个重要里程碑。高效的MoE架构为综合性能奠定了坚实的基础。此后，DeepSeek在V3上快速迭代，发布了V3.1以提高推理和代理能力，并于2025年12月发布最新正式版本V3.2。同时还发布了特殊版本V3.2-Speciale，专注于解决数学和学术难题。科技媒体 The Information 此前曾报道过消息，DeepSeek 将在今年 2 月中旬春节期间推出新一代 AI 旗舰 DeepSeek V4，拥有更强大的编码能力。今年早些时候，DeepSeek团队发表了两篇论文，曝光了两种创新架构：这优化了Transformer的深层信息流，使模型训练更加稳定和可扩展，在不增加计算负载的情况下提高性能。 Engram（条件记忆模块）将静态知识与动态计算分离，使用廉价的DRAM来存储实体知识，释放昂贵的HBM来专注于推理，并显着降低长上下文推理的成本。同日，我们收到MiniMax的消息，M2.5型号即将正式上市。 MiniMax M2.5型号目前正在国外进行MiniMax Agent产品的内部测试。每日经济新闻一般公共关系。
特别提示：以上内容（包括图片、视频，如有）由自有媒体平台“网易账号”用户上传发布。本平台仅提供信息存储服务。
注：以上内容（含图片、视频，我fany）由网易号用户上传并发布，网易号是一个仅提供信息存储服务的社交媒体平台。

归档

分类

由 admin

发表回复取消回复

您错过了

IDC：存储芯片短缺导致智能手机市场可能下滑13%

80岁仍记忆力极佳的大脑有什么区别？

美国拟有条件放松对古巴石油禁运

美国政府对伊朗新核协议的限制曝光：无到期条款

Deepseek、Zhipu 和 MiniMax 联合发布新版本

由 admin

相关文章

80岁仍记忆力极佳的大脑有什么区别？

美国政府对伊朗新核协议的限制曝光：无到期条款

小米：自媒体向“AutoReport”赔偿500万元。在多个网络平台上传播未经证实、自称且明显贬义的内容。

发表回复 取消回复

您错过了

IDC：存储芯片短缺导致智能手机市场可能下滑13%

80岁仍记忆力极佳的大脑有什么区别？

美国拟有条件放松对古巴石油禁运

美国政府对伊朗新核协议的限制曝光：无到期条款

发表回复取消回复