Ferly 发表于 2025-11-9 01:12

DeepSeek时刻再次出现,Kimi K2 Thinking智能推理能力超过GPT-5

11月8日讯,智能推理的方面,在人类终极考试( HLE)这项超难基准上,Kimi K2 Thinking 取得44.9%的分数,超过了Grok4、GPT-5、Claude 4.5等先进模型。如果是 Kimi K2 Thinking Heavy,分数还可以进一步达到 51%。HuggingFace联合创始人Thomas Wolf置评Kimi K2 Thinking称,我们正在见证又一次DeepSeek时刻,开源软件再次超越闭源软件,今后是不是每隔几个月就会发生一次这种情况?


Ferly 发表于 2025-11-9 01:13

DeepSeek时刻再次出现,Kimi K2 Thinking智能推理能力超过GPT-5

王运成 发表于 2025-11-9 14:41

感谢提供信息分享。
页: [1]
查看完整版本: DeepSeek时刻再次出现,Kimi K2 Thinking智能推理能力超过GPT-5