MMLU评测

2024-12-24 11:39:17 4

MMLU,全名为Massive Multitask Language Understanding,是一种用于评估大规模语言模型语言理解能力的标准化测试。它由加利福尼亚大学伯克利分校的研究团队于2020年9月发布,是当前最具影响力的大型语言模型语义理解评估之一。该测试包括57项不同的任务,涵盖领域从基础数学到美国历史,再到计算机科学、法律等多个知识领域。这些任务内容十分广泛,使用英语进行,旨在全面评估大模型在知识覆盖和理解能力方面的表现。

本文转载自互联网,如有侵权,联系 478266466@qq.com 删除。

相关推荐