月之暗面今年以来的技术迭代还在继续。
(相关资料图)
11月6日晚间,月之暗面旗下Kimi大模型发布了Kimi K2 Thinking,并称其为“Kimi迄今能力最强的开源思考模型”。
Kimi官方表示,Kimi K2 Thinking是基于“模型即Agent(智能体)”理念训练的新一代Thinking Agent,它原生掌握“边思考,边使用工具”的能力。
从实测成绩来看,Kimi K2 Thinking在“人类最后的考试”(Humanity"s Last Exam)、自主网络浏览能力(BrowseComp)、复杂信息收集推理(SEAL-0)等多项基准测试中表现达到SOTA(当前技术水平的最前沿)水平。
自7月进入“K2”版本之后,Kimi的升级正在提速。9月5日,Kimi发布Kimi K2模型的最新版本“0905”,进一步提升其在真实编程任务中的表现。9月25日,月之暗面Kimi发布全新Agent模式“OK Computer”并开启灰度测试。
这也是整个AI市场的一个缩影。事实上,AI市场正进入快速迭代阶段。据QuestMobile发布的2025年三季度AI应用行业报告,以头部互联网集团为例,今年1月—9月共完成182次模型发布/更新/迭代,平均每5.7天就迎来一次模型升级。
模型迭代节奏持续加快,技术竞争正转向应用能力与推理深度的实战较量。
在“人类最后的考试”中超越GPT-5(High)
据Kimi官方,Kimi K2 Thinking是“Kimi迄今能力最强的开源思考模型”,这一定位源于其在技术架构、任务执行与评测表现上的系统性突破。
作为基于“模型即Agent”理念训练的新一代Thinking Agent,Kimi K2 Thinking实现了“边思考,边使用工具”的原生能力融合。该模型可在无人干预的情况下,自主完成多达300轮的工具调用与多轮思考,可提升处理复杂问题的连续性与稳定性。
在多项关键能力维度上,Kimi K2 Thinking均有明显进步,其Agentic(智能代理)搜索、Agentic编程、写作与综合推理性能得到进一步强化。
在推理能力方面,该模型在涵盖100多个专业领域的“人类最后的考试”(Humanity"s Last Exam)中取得了卓越成绩。该测试允许使用搜索、Python及网络浏览等工具,Kimi K2 Thinking以44.9%的得分达到SOTA水平。作为对比,Kimi公布的同场测试中GPT-5(High)的成绩为41.7%。
面对信息过载的复杂搜索场景,Kimi K2 Thinking同样表现出色。BrowseComp测试旨在评估AI在信息密集环境中的坚持性与创造力。在该项测试中,人类平均得分仅为29.2%,而Kimi K2 Thinking以60.2%的成绩刷新了SOTA纪录。
此外,该模型在编程相关任务中亦有稳步提升。在多语言软件工程基准SWE-Multilingual、SWE-bench验证集以及Terminal终端使用等测试中,其表现有了进一步提升。
除了专项能力的突破,Kimi表示Kimi K2 Thinking模型在通用基础能力上也实现同步升级。无论是在创意写作、学术研究,还是在回应个人与情感类问题时,模型都展现出更成熟的理解与表达能力。
为进行对比验证,《每日经济新闻》记者使用与测试Kimi K2时相同的提示词,要求Kimi K2 Thinking模型以2025年北京高考作文题“数字闪耀时”为例,模拟高中生身份完成一篇一类记叙文。从结果看,文章结构完整、扣题准确,但在切题方式上,该模型与K2一样,仍存在表达略显生硬的情况。
使用了长思考模式的Kimi撰写的作文图片来源:Kimi网页版截图
目前,Kimi K2 Thinking模型的API(应用程序编程接口)已在Kimi开放平台正式上架,支持256K上下文长度,定价与Kimi K2-0905相同:每百万Token(大模型处理文本时的最小单位)输入收费4元,输出16元,若命中缓存,输入费用仅为1元。同时,平台也推出了生成速度高达100 Token/s的Turbo API,其每百万Token输入为8元,输出58元,命中缓存的输入同样为1元。
Kimi能否破局“红海”竞争
然而,技术优势能否成功转化为市场认可,是摆在Kimi K2面前的首要挑战。
QuestMobile数据显示,今年三季度,接近60%的原生App陷入负增长,对于新入局者或中小应用而言,独立打造一款成功的原生App的窗口正在收窄。2025年,国内大模型竞争已从初期的“百花齐放”步入“巨头主导”的新阶段。
Kimi自身的增长也面临压力。
根据量子位智库10月数据,在AI助手APP新增下载榜上,Kimi与DeepSeek分别以超420万和360万的下载量位列第三、四位,但相较9月,两者的下载量均下滑超过13%。与此同时,字节跳动的“豆包”以近2800万新增下载稳居第一,腾讯“元宝”则以超1300万下载、环比14%的涨幅位列第二。大厂凭借其生态优势,持续挤压着独立应用的生存空间。
并且,更多跨界玩家正依托自身业务场景加速入局。11月3日,美团LongCat(龙猫)团队宣布推出全新开源大模型LongCat-Flash-Omni,这也是美团在两个月内第四次发布新模型。
另一个行业信号是AI交互成本的下降。
QuestMobile在报告中表示,人均单次Token消耗的下降也标志着AI行业进入了一个以“效率提升、成本控制、价值驱动”为特征的新阶段。这是行业走向成熟和商业化的关键信号。
在此背景下,今年以来的Kimi正尝试通过垂类合作探索商业化路径。今年“双11”期间,《每日经济新闻》记者测试发现Kimi更新了“导购”功能,可根据用户需求推荐商品并附带淘宝或京东链接,不过商品多来自代理店铺,尚未与官方旗舰店打通。相较于字节“豆包+抖音”、阿里“通义+电商”的生态闭环,Kimi暂未形成同等强度的业务绑定。
数据表明,具备清晰场景的垂直类AI应用仍具有增长潜力。据QuestMobile,字节跳动旗下即梦AI、豆包爱学及蚂蚁集团旗下AQ健康管家等垂类应用三季度月活跃用户规模复合增长率分别达12.1%、15.7%和83.4%。
对Kimi而言,差异化的核心在于将模型能力转化为用户可感知的价值。其能否在Agent搜索、编程助手、深度研究等场景建立起不可替代性,将决定技术升级的市场成效。
Kimi K2 Thinking展现出的技术纵深,为月之暗面在“思考型Agent”这一差异化路径上赢得了重要筹码。然而,在白热化的大模型竞争中,技术领先性只是入场券,能否将“长思考”“强推理”的模型能力,转化为用户高频依赖的应用场景,并构建起可持续的商业模式,才是真正的破局关键。
原生掌握“边思考,边用工具” Kimi “史上最强”开源思考模型能否破局AI红海? 时讯 【原生掌握“边思考,边用工具”Kimi“史上最强”开源思考模型能否破局
林葳两战12投0中 CBA本土得分王在NCAA得分咋就那么难? 林葳两战12投0中CBA本土得分王在NCAA得分咋就那么难?,林葳,同曦,cba,
6人上双居然输球!火箭5连胜被终结,杜兰特24分8失误连续低迷|即时焦点 6人上双居然输球!火箭5连胜被终结,杜兰特24分8失误连续低迷,火箭,马
华电科工再签重大合同 总金额约34亿元_每日快播 近日,华电科工(601226)作为联合体牵头人协同江苏亨通高压海缆有限公
当前热点埃尔切vs皇家社会:拉法-米尔、佩德罗萨首发,久保建英、奥亚萨瓦尔出战 埃尔切vs皇家社会:拉法-米尔、佩德罗萨首发,久保建英、奥亚萨瓦尔出
新疆哈密“为人民服务”等5处飞行地标被认定为文物保护单位-今热点 记者11月7日从新疆哈密市文化体育广播电视和旅游局(文物局)获悉,位
原生掌握“边思考,边用工具” Kimi “史上最强”开源思考模型能否破局AI红海? 时讯 【原生掌握“边思考,边用工具”Kimi“史上最强”开源思考模型能否破局
【报资讯】天合光能:朱文瑾由非独立董事转任职工代表董事 11月7日,天合光能(证券代码:688599)发布公告称,因公司治理结构调
未来三天湖南天气以阴雨为主,湘中以北局地大雨 今日热闻 三湘都市报·新湖南客户端11月8日讯(全媒体记者李致远)11月8日,据湖
第42次南极考察丨挺进南半球!“雪龙”号穿越赤道 中国第42次南极考察队在“雪龙”号上举行了穿越赤道纪念活动。队员们排
预告!快辑半导体将于美东时间11月11日盘后披露财报-焦点资讯 根据同花顺(300033)iFind数据,快辑半导体将于美东时间11月11日盘后
林葳两战12投0中 CBA本土得分王在NCAA得分咋就那么难? 林葳两战12投0中CBA本土得分王在NCAA得分咋就那么难?,林葳,同曦,cba,
6人上双居然输球!火箭5连胜被终结,杜兰特24分8失误连续低迷|即时焦点 6人上双居然输球!火箭5连胜被终结,杜兰特24分8失误连续低迷,火箭,马
“诗行广西 逐梦青春”优秀作品②丨《桂水谣》 新闻眼以诗歌之名记录旅途之美,无论是漓江水的碧波荡漾、还是八桂大地
当前关注:聚焦十五运|记者看全运:没有“村”的全运会 作为报道过多次大型赛事的“老记”,每次到达采访地,第一件事情都是入
新动态:Yole:先进封装材料,增速显著 公众号记得加星标,第一时间看推送不会错过。
天天资讯:特斯拉国产Model Y长续航后驱开售 28.85万元起 11月8日,据特斯拉中国官网显示,ModelY长续航后轮驱动版正式开售,28
福建舰更多细节公布!一组动图带你全方位看清楚 每日快报 container{width:100%;max-width:720px;margin:0auto;}11月5日,福建
华电科工再签重大合同 总金额约34亿元_每日快播 近日,华电科工(601226)作为联合体牵头人协同江苏亨通高压海缆有限公
【ETF动向】11月7日国泰上证科创板创新药ETF基金跌2.24%,份额增加8200万份 证券之星消息,11月7日,国泰上证科创板创新药ETF基金(589720)跌2 24
衡水稷樽酒业有限公司成立 注册资本3万人民币 天眼查App显示,近日,衡水稷樽酒业有限公司成立,法定代表人为李友恒
当前热点埃尔切vs皇家社会:拉法-米尔、佩德罗萨首发,久保建英、奥亚萨瓦尔出战 埃尔切vs皇家社会:拉法-米尔、佩德罗萨首发,久保建英、奥亚萨瓦尔出
视点!航天彩虹:拟出售土地及地上建筑物产权 新京报贝壳财经讯11月7日,航天彩虹(002389)公告,公司拟以不低于4 0
焦点速递!“超级月亮”刷屏 它是如何形成的? 中新网北京11月7日电(记者上官云)近日,一轮“超级月亮”在天空惊艳亮
秦皇岛鸣润再生资源回收有限公司成立 注册资本50万人民币 热门看点 天眼查App显示,近日,秦皇岛鸣润再生资源回收有限公司成立,法定代表
致敬柴古唐斯括苍越野赛十周年,SALOMON陪伴中国跑者共赴世界舞台 在刚刚结束的2025柴古唐斯括苍越野赛上,SALOMON精英战队展现出卓越
新疆哈密“为人民服务”等5处飞行地标被认定为文物保护单位-今热点 记者11月7日从新疆哈密市文化体育广播电视和旅游局(文物局)获悉,位
焦点讯息:PTA企业的龙头有哪些(2025/11/7) PTA龙头有哪些?据南方财富网概念查询工具数据显示,PTA龙头有:恒力石
神州信息部分董事及高管拟合计减持不超38.095万股 神州信息(000555)(000555 SZ)发布公告,公司董事兼总裁李鸿春先生、
南大光电:子公司南大光电(乌兰察布)有限公司目前主要从事三氟化氮的生产、销售... 南大光电:子公司南大光电(乌兰察布)有限公司目前主要从事三氟化氮的
视频丨同比增长3.6% 前10个月我国货物贸易进出口平稳增长 焦点滚动 视频丨同比增长3 6%前10个月我国货物贸易进出口平稳增长,进出口,外贸
2025福布斯中国内地富豪榜发布 人民财讯11月7日电,2025福布斯中国内地富豪榜发布。福布斯中国指出,
珂玛科技:截至10月31日股东户数26732户 珂玛科技:截至10月31日股东户数26732户
动态:山高新能源及联、合营公司9月营运发电量约46万兆瓦时,同比下降16.4% 11月7日,山高新能源(01250)发布公告,2025年9月,本集团及联营和合
紫光国微副总裁杜林虎因工作原因辞职 热推荐 11月7日,紫光国微(002049)发布公告,公司副总裁杜林虎因工作原因申
快资讯:崇州市皓丰皮业有限公司成立 注册资本30万人民币 天眼查App显示,近日,崇州市皓丰皮业有限公司成立,法定代表人为高辉
致敬柴古唐斯括苍越野赛十周年,SALOMON陪伴中国跑者共赴世界舞台 在刚刚结束的2025柴古唐斯括苍越野...
净利润近10亿、毛利率25.6% 新城控股三季报彰显盈利可持续性 10月底,上市房企进入三季度业绩密...
11月1日,东莞迎来第三个“东莞民营企业家日” 11月1日,东莞迎来第三个“东莞民...
京东11.11大牌纸品超级秒杀日10月30日开启,大牌纸品6折起 10月31 日,京东11 11大牌纸品超...
国庆假期怀柔北部山区的红叶进入最佳观赏期 吸引游客前来赏秋景 国庆假期,怀柔北部山区的红叶进入...
重磅!四川省科创贷款较年初新增620.35亿元 同比增长21.22% 记者日前从中国人民银行成都分行获...
252项“全程网办”!川渝两地企业登记档案实现跨区域互查 8月30日,记者从省大数据中心获悉...
2022年中国国际服务贸易交易会在京举办 四川参展企业数量创新高 8月31日至9月5日,主题为服务合作...