Avatar
Ai卡卡罗特(每天教Ai)
⽂⼼X1.1在SuperCLUE中击败⼀众模型!
家人们谁懂啊!刚刷到SuperCLUE-CPIF的测评结果,我直接从沙发弹起来!10个中外大模型神仙打架,结果百度文心X1.1拿着75.51分的成绩单,把“国产第一”的奖杯焊在手里了!
你们敢信吗?这测评可不是闹着玩的,专门考AI能不能精准拿捏复杂指令🧐。比如让它写方案要事实准、逻辑顺,还得有点文采✍️;处理共享单车用户问题,要分用户等级、看问题类型,连用户啥情绪都得照顾到——结果文心X1.1全搞定了,比我那靠谱的同事还靠谱!
再看榜单细节,不管按“任务类型”分还是按“指令数量”分,文心X1.1都稳坐国产第一的位置。后面的DeepSeek和腾讯模型追得气喘吁吁,也只能看着它的背影叹气。咱就是说,这波属于是“AI圈学霸期末考,直接把满分线拉到自己水平”!
发布于 2025-10-21