-
460万美元训练出顶级大模型? 月之暗面杨植麟亲自回应
(文/陈济深 编辑/张广凯)
11月6日,月之暗面发布最新模型Kimi K2 Thinking,在Humanity's Last Exam、TAU-Bench等重要基准测试中,超越GPT-5、Claude 4.5等全球最强开源乃至闭源模型。
在Kimi发布更新的同一天,英伟达CEO黄仁勋关于“中国将赢下人工智能全球竞赛”的最新言论更是让这个中国大模型吸引了全世界的关注。
在专业机构 Artificial Analysis 智能体工具的调用测试中,Kimi K2 Thinking的得分达到93%,是目前第三方机构测量到的最高分;在智能指数中,则以67分排名第3,仅次于GPT5。

K2 Thinking在几个关键领域实现了重大突破:首先是采用了“超稀疏MoE”架构,用极高的效率获得了万亿级模型的强大知识;其次是实现了“原生INT4量化”,在训练中就解决了精度与效率的矛盾,大幅提升了推理速度并降低了硬件门槛;最关键的是,它在“智能体”(Agent)工具调用能力上实现了质的飞跃,在衡量“AI数字员工”能力的TAU-Bench测试中登顶。
在发布后仅仅48小时不到,Kimi K2 Thinking下载量已超过5万,成为人工智能全球最大开源社区Hugging Face最热门的开源模型。
“这是另一个DeepSeek时刻吗?”Hugging Face联合创始人Thomas Wolf在个人社交账号上敲下评论。海外的开源社区和科技媒体上,开发者对Kimi K2 Thinking的赞誉也纷至沓来。
除了性能上的突破,一则传闻的出现更是让Kimi引发了市场的强烈关注。CNBC报道称,Kimi K2的训练成本仅为460万美元。
这也意味着,Kimi仅用了OpenAI训练GPT5不到1%的成本就训练出了不输GPT5的全球顶级大模型,而33亿美元估值的月之暗面比起目前估值突破5000亿,旨在冲击万亿美元市值的OpenAI更是可以忽略不计,而就是这个中国的“小”玩家却用极低的成本搓出了一个顶级模型。
面对这个震撼的对比,K2 Thinking在引发市场关注的同时,也引发了部分人群的质疑,Kimi新模型的训练成本到底是多少?Kimi这次登顶是不是跑分刷榜?Kimi不做多模态模型是不是就是为了刷榜而不是应用?
11月11日深夜,月之暗面月之暗面联合创始人兼CEO杨植麟,以及联合创始人周昕宇和吴育昕,在Reddit举办了一场AMA (Ask Me Anything,问我任何事),回应了诸多外界的关注内容。
从回答阵容来看,杨植麟用了一个叫“ComfortableAsk4494”的账号来直接在线答疑。
对于大家最关心的训练成本问题,杨植麟直接坦言460万美元不实。
他表示:“这不是官方数据。由于训练成本中很大一部分是研究和实验,所以很难量化具体数字。”
而对于优先聚焦文本模型是为了短期刷榜,还是准备持续深耕文本领域的问题,杨植麟则明确表示,“训练视觉语言模型需要时间获取数据和调整训练,所以我们决定先发布一个文本模型。”
甚至有网友问到为什么OpenAI会烧那么多钱,杨植麟更是坦言“我不知道”。
还有网友质疑,Kimi K2 Thinking是否经过专门训练,以在HLE这一基准测试中取得好成绩?它的高分似乎与实际使用中的智能水平不太相符。
杨植麟回应道,Kimi K2 Thinking在提升智能体推理能力方面取得了一些进展,使其在HLE测试中得分较高。月之暗面正在努力进一步提升其通用能力,以便在更多实际应用场景中充分发挥智能的作用。
另有网友问道:“为何K2 Thinking能在一次推理中保持如此长的思维链,而GPT-5不行?”
杨植麟解释道:“我认为推理时间取决于API吞吐,而推理token的数量取决于模型训练方式。我们在训练Kimi K2 Thinking时倾向于使用更多的思考token以获得最佳效果。我们的Turbo API会更快,同时Kimi K2 Thinking原生采用INT4,这也提升了推理速度。
Kimi K2系列模型不阿谀奉承、直接的文风在AI界算是一股清流,有不少网友认可这种风格。吴育昕称,这种写作风格是模型后训练数据和评估的重要组成部分。
月之暗面三位联合创始人还集中回应了与模型服务、开源等相关话题的疑问。
有网友称,Kimi在自己的公司已经成为主要的测试模型,但生产环境会切换到美国本土的模型。这主要是因为领导层担心Kimi是“中国大模型”,可能存在一些风险。
这位网友还分享,自己很喜欢使用Kimi App,自己一位在亚马逊工作的朋友也很喜欢这一应用,但由于亚马逊有规定必须使用自家的AI助手,禁止在工作场合使用其他主流的AI助手App。网友担心,随着Kimi逐渐变得知名,她会不会再也无法在工作场合中使用呢?
吴育昕回应称:“虽然被封禁往往超出我们的控制范围,但开源该模型有望成为消除部分顾虑的有效途径(企业可以自行部署)。我们希望看到一个更加信任的世界,但这需要时间。”
上下文一直是影响AI模型在生产环境应用的重要因素。目前,Kimi K2 Thinking最大支持256K的上下文,有网友反馈这对大型代码库而言并不算大。
杨植麟称,月之暗面应该能在未来的版本中增加上下文长度。
还有网友希望月之暗面能将模型上下文窗口提升到100万个token,周昕宇回复道,月之暗面之前已尝试过100万个token的上下文窗口,但当时的服务成本太高,未来他们会重新考虑更长的上下文窗口。
当被问及有无AI浏览器的开发计划时,周昕宇十分犀利地回复道:要做出更好的模型,并不需要再去套一层新的Chromium壳。
杨植麟称,月之暗面目前将专注于模型训练,但会不断更新kimi.com ,使其包含最新功能。
还有不少网友提到,希望月之暗面能推出规模更小的模型。杨植麟称,Kimi-Linear-48B-A3B-Instruct就是月之暗面发布的小型模型之一,未来他们可能会训练更多模型并添加更多功能。
目前,Kimi已经提供了编程订阅方案,这一计费方式是基于API请求次数,有网友称这种模式导致资源消耗偏高。月之暗面回应称,API请求次数计费能让用户看到费用明细,同时也更符合企业的成本结构。不过,他们会尽快找到更好的方案。
从社区中海外开发者的热烈提问和尖锐反馈可以看出,以Kimi系列为代表的中国模型正受到前所未有的关注。月之暗面此次在Reddit平台的公开问答,集中回应了全球网友对Kimi技术细节的大量兴趣和疑问。这种关注背后,也折射出全球开发者对中国AI创新能力的认可。
- 责任编辑: 陈济深 
-
1499元买飞天茅台!2025双11高端白酒价格“大跳水”
2025-11-11 16:58 观网财经-消费 -
国家发改委:项目前期阶段就论证引入民间资本参与,提供更多参与机会
2025-11-11 16:05 -
苹果iPhone新野心:绕开运营商,直连卫星上网
2025-11-11 14:05 产经 科创 -
上纬新材,要发变形机器人?
2025-11-11 14:00 产经 科创 -
超级供应链:一个贯穿京东22年创业史的“阳谋”
2025-11-11 13:58 -
裁员or赋能?中美AI一场关乎1.7亿岗位的暗战
2025-11-11 11:14 产经 全球市场 -
“大幅削减产量”,苹果被曝推迟下一代iPhone Air
2025-11-11 11:02 产经 科创 -
智能早报丨百度、文远知行在阿布扎比开展全无人商业化运营
2025-11-11 09:59 产经 热点关注 -
行业低迷期入局家装,芝华士母公司敏华控股“作茧自缚”?
2025-11-11 09:40 产经 A股/港股/美股 -
“闪存合同价上调50%”,美股存储芯片龙头齐冲新高
2025-11-10 20:59 观网财经-科创 -
合肥国资29亿“输血”国产OLED
2025-11-10 17:37 产经 科创 -
中国韩妆市场复苏,爱茉莉太平洋打出“科技牌”
2025-11-10 17:28 观网财经-消费 -
谷歌前CEO:中国正在塑造未来
2025-11-10 17:13 观网财经-科创 -
中国电科+中国电子,交叉持股、战略合作
2025-11-10 16:12 观网财经-科创 -
“太子集团”头目陈志被曝曾在新加坡遭“黑吃黑”
2025-11-10 15:38 -
智元机器人公司完成股改
2025-11-10 12:49 观网财经-科创 -
陈睿:曹雪芹写红楼梦不为挣稿费,好内容需要时间沉淀和验证
2025-11-10 11:20 观网财经-互联网 -
智能早报丨黄仁勋造访台积电3nm产线索取产能;万华化学突破机器人“仿生皮肤”材料
2025-11-10 09:54 今日财经 -
最低仅4.99万元,京东“国民好车”埃安UT super正式发布
2025-11-09 22:59 消费 -
对话欧莱雅集团CEO叶鸿慕:从“在中国制造”到“为中国创造”
2025-11-09 22:39 品牌实验室
相关推荐 -
普京访印:美国都在买,印度凭啥不能买? 评论 56
日本开发稀土担心中国干扰?日防相放话 评论 127
“美欧抢矿,遭殃的却是他们” 评论 13
美国又开炮欧盟:你们在“霸凌”美国军工! 评论 72
时代变了,“欧洲人迫切想要中国技术” 评论 205最新闻 Hot-
普京访印:美国都在买,印度凭啥不能买?
-
任正非:未来时代的希望在青年
-
自民党“黑金”丑闻“吹哨人”再出手,这次是高市
-
呵呵,“‘民主国家’看不上中国技术”
-
“白宫‘慌乱应对’,想赢中国,支持得到位啊”
-
机密通话曝光!“美国恐将背叛,你要小心”
-
“云冈石窟大佛冻得流鼻涕”,官方:将暂时封闭、处置渗水
-
“高市早苗更加不安了”
-
高善文离职后,又有分析师集体出走国投证券
-
台军又出意外,这次是炮弹砸了民宅
-
“中产、富裕阶层也去1元店”,特朗普还嘴硬
-
国安战略报告迟迟未出,“美财长要求软化对华措辞”
-
“彻底反转了,中国是发达国家,我们才是新兴国家”
-
日本开发稀土担心中国干扰?日防相放话
-
“按下葫芦浮起瓢”,英伟达想重返中国市场又难了…
-
“特朗普高兴太早咯,中国把枪放进枪套,但枪还在手上”
-

观察员
上海市互联网违法与不良信息举报中心