C-Eval是一个专门为大规模语言模型设计的中文评估工具套件,由上海交通大学、清华大学和爱丁堡大学的研究团队共同开发,并于2023年5月正式发布。该套件包含了13948个多项选择题,覆盖52个不同学科领域,设置了四个难度等级,旨在评估大型语言模型在中文理解方面的表现。
本文转载自互联网,如有侵权,联系 478266466@qq.com 删除。