DEVBENCH
收藏arXiv2024-06-15 更新2024-06-19 收录
下载链接:
github.com/alvinwmtan/dev-bench
下载链接
链接失效反馈官方服务:
资源简介:
DEVBENCH是由斯坦福大学创建的多模态语言学习基准数据集,包含七个任务,分别评估词汇、句法和语义能力。数据集包含儿童和成人的行为数据,旨在通过比较模型与人类的响应模式,揭示模型与人类语言学习的差异。数据集的创建过程涉及从多个来源收集数据,并确保数据的匿名化和适当的许可。DEVBENCH的应用领域主要集中在语言模型的开发和评估,特别是在理解和发展更接近人类语言学习过程的模型方面。
提供机构:
斯坦福大学
创建时间:
2024-06-15



