AI行业百模大战:胜负难分,GPT成国内厂商靶子
本文介绍了 AI 行业的“百模大战”状况,自从 GPT 成为国内厂商的靶子以来,各大厂商都在发布大模型时将其与 GPT 做比较,但实际上用户体验表明,一些声称超越 GPT 的大模型产品表现并不尽如人意。此外,由于各种不同的统计排名口径,使得“第一”太多,榜单快不够用了。文章指出,大模型相关的榜单很多,其中 SuperCLUE 和 C-Eval 是较为知名的两份评测榜单,但它们都存在一定的局限性和问题,如刷榜等现象。因此,如何评价和大模型厂商的表现成为一个值得探讨的问题。