夸克

Ai卡卡罗特（每天教Ai）

⽂⼼X1.1在SuperCLUE中击败⼀众模型！

家人们谁懂啊！刚刷到SuperCLUE-CPIF的测评结果，我直接从沙发弹起来！10个中外大模型神仙打架，结果百度文心X1.1拿着75.51分的成绩单，把“国产第一”的奖杯焊在手里了！

你们敢信吗？这测评可不是闹着玩的，专门考AI能不能精准拿捏复杂指令🧐。比如让它写方案要事实准、逻辑顺，还得有点文采✍️；处理共享单车用户问题，要分用户等级、看问题类型，连用户啥情绪都得照顾到——结果文心X1.1全搞定了，比我那靠谱的同事还靠谱！

再看榜单细节，不管按“任务类型”分还是按“指令数量”分，文心X1.1都稳坐国产第一的位置。后面的DeepSeek和腾讯模型追得气喘吁吁，也只能看着它的背影叹气。咱就是说，这波属于是“AI圈学霸期末考，直接把满分线拉到自己水平”！

发布于 2025-10-21