国内大规模人工智能模型的重磅新闻接连出现。 2月11日晚,智浦官方确认,在全球模型服务平台OpenRouter最受欢迎车型排行榜上名列前茅的神秘“小马阿尔法”车型,就是智浦GLM-5的全新车型。新模型现已上线chat.z.ai平台。 2月6日,全球模型服务平台OpenRouter悄然发布了代号“Pony Alpha”的匿名模型。凭借其强大的编码能力、超长的上下文窗口以及全面的代理工作流程优化,它迅速引起了开发者社区的关注,并迅速在国外社区流行起来。 OpenRouter官方将Pony Alpha描述为“下一代基础模型”,在角色调度、代理工作流程、推理和游戏操作系统方面具有强大的性能,特别注重“极高的工具调用准确性”。此功能为 AI 代理提供了重要的好处应用场景。开发人员可以通过 Claude Code 等工具调用模型,从而能够在数小时内开发复杂的项目。 1月8日,智浦在香港联交所正式挂牌上市。上市当天,公司首席科学家、清华大学计算机系教授唐杰向全体员工发出内部信,确认新一代基础模型GLM-5“即将推出”,并宣布从2026年开始“大规模回归基础模型研究”,成立专注于架构、学习范式和持续进化三大方向的前沿创新部门X-Lab。此外,DeepSeek还更新了其modeit。报道称,一些用户报告称 DeepSeek 在网络和应用程序中进行了更新,以支持高达 100 万(百万)个令牌的上下文长度。去年8月发布的DeepSeekV3.1的上下文长度已扩展到128K。当前ly,很少有模型可以将上下文带到百万级别。 Google 的 Gemini 系列和 Anthropic 的 Claude Opus 4.6 在实现这一目标方面处于领先地位。 DeepSeek的V系列机型定位为入门机型,追求整体性能的极致。 2024 年 12 月发布的 V3 基础模型是 DeepSeek 的一个重要里程碑。高效的MoE架构为综合性能奠定了坚实的基础。此后,DeepSeek在V3上快速迭代,发布了V3.1以提高推理和代理能力,并于2025年12月发布最新正式版本V3.2。同时还发布了特殊版本V3.2-Speciale,专注于解决数学和学术难题。科技媒体 The Information 此前曾报道过消息,DeepSeek 将在今年 2 月中旬春节期间推出新一代 AI 旗舰 DeepSeek V4,拥有更强大的编码能力。今年早些时候,DeepSeek团队发表了两篇论文,曝光了两种创新架构:这优化了Transformer的深层信息流,使模型训练更加稳定和可扩展,在不增加计算负载的情况下提高性能。 Engram(条件记忆模块)将静态知识与动态计算分离,使用廉价的DRAM来存储实体知识,释放昂贵的HBM来专注于推理,并显着降低长上下文推理的成本。同日,我们收到MiniMax的消息,M2.5型号即将正式上市。 MiniMax M2.5型号目前正在国外进行MiniMax Agent产品的内部测试。每日经济新闻一般公共关系。
特别提示:以上内容(包括图片、视频,如有)由自有媒体平台“网易账号”用户上传发布。本平台仅提供信息存储服务。
注:以上内容(含图片、视频,我fany)由网易号用户上传并发布,网易号是一个仅提供信息存储服务的社交媒体平台。