上海AI独角兽公司MiniMax发布多项核心技术与产品
发布时间:2025-06-23 20:12 浏览量:2
央广网北京6月23日消息(记者 邹煦晨)上海AI独角兽公司MiniMax的“技术发布周”接近尾声。自6月17日以来,MiniMax发布了一系列核心技术与产品,涵盖基座模型、视频生成模型、多模态智能体等多个方向,系统展现其“模型—多模态—应用”一体化技术路线。
从开源大规模混合架构推理模型MiniMax-M1、聚焦物理表现的视频模型Hailuo-02,到定位于”可执行的数字员工“的MiniMax Agent,再到成片创作助手Hailuo Agent、音色设计工具Voice Design,MiniMax表示,在当下全球AI竞赛进入“下半场”的关键节点,此次一系列密集发布不仅是对公司技术积累的集中展示,更为行业发展路径和竞争格局注入全新变量。
作为底层基础能力的支撑,MiniMax发布并开源了自主研发的MiniMax-M1系列模型。在近期的 Artificial Analysis Intelligence Index 榜单中,MiniMax-M1位列全球开源模型第二名。
技术报告显示,MiniMax-M1模型在处理百万级Token长文本上取得突破,支持高达100万Token上下文窗口及8万Token推理输出,能够为复杂文档分析、长篇代码生成等任务提供有效支持。在工具调用(TAU-bench)、代码生成(SWE-bench)、长文本理解(MRCR)等17个主流评测中,M1 表现优异。其中,M1-40k在TAU-bench任务中超越所有开源模型;在MRCR任务中,位列全球第二。
配套算法方面,MiniMax推出了新的CISPO强化学习优化算法。该算法通过裁剪重要性采样权重以提升稳定性,区别于传统方法中对Token更新策略的依赖。实验数据显示,在AIME(AI-powered Moral Evaluator)等测试中,CISPO的收敛速度较DAPO快一倍,也优于GRPO算法。
在多模态生成领域,MiniMax 推出新一代视频大模型 Hailuo 02,主打高保真物理模拟与直接生成 1080P 画质视频能力,可处理复杂运动和光影场景,如体操动作、火焰喷射等,在物理一致性方面取得进展。在国际评测榜单 Artificial Analysis 视频竞技场中,Hailuo 02 位居全球第二。
此次发布的MiniMax Agent定位为“可执行的数字员工”,支持多步规划、动态执行复杂任务。例如,在“Mag 7投资组合分析”任务中,Agent可自动调用工具完成数据搜集、策略验证并生成可视化报告。
Hailuo Video Agent则通过自然语言驱动全局、全流程工具集调用,实现“零门槛专业级视频生成”。用户输入“制作一段城市延时摄影”,即可一键生成包含分镜、剪辑、配音的完整成片。
此次发布的模型还包含语音模型Speech 02上的一个功能更新,Voice Design 音色设计。用户可以通过自然语言来描述自己心中所想的音色,实现对多个维度的精准控制。
分析人士认为,MiniMax的创新之路为全球AI发展提供了第二条道路。面对外部的算力限制和技术封锁,MiniMax没有选择跟随和模仿,而是坚定地走了“自主创新”这条更艰难的路。从底层基础模型优化,到开创性的线性注意力混合架构,再到CISPO和NCR等算法与架构的持续迭代,MiniMax的创新呈现出一种“环环相扣、层层递进”的良性循环。这种“倒逼出来的创新能力”,证明了通过算法和架构的深度优化,完全可以打破“算力-资本”的壁垒。
更多精彩资讯请在应用市场下载“央广网”客户端。欢迎提供新闻线索,24小时报料热线400-800-0088;消费者也可通过央广网“啄木鸟消费者投诉平台”线上投诉。版权声明:本文章版权归属央广网所有,未经授权不得转载。转载请联系:cnrbanquan@cnr.cn,不尊重原创的行为我们将追究责任。