CT-Eval

Name: CT-Eval
Creator: 早稻田大学
Published: 2024-05-21 00:58:02
License: 暂无描述

arXiv2024-05-21 更新2024-08-06 收录

下载链接：

http://arxiv.org/abs/2405.12174v1

下载链接

链接失效反馈

官方服务：

资源简介：

CT-Eval是一个专为评估大型语言模型在中文文本到表格任务上性能而设计的数据集。该数据集由早稻田大学创建，涵盖了28个不同领域，确保了数据的多样性。数据集的构建过程中，首先从百度百科这一流行的中文多学科在线百科中收集文档-表格对，然后使用大型语言模型作为幻觉判断器，过滤掉含有幻觉的任务样本，最后通过人工标注者进一步清理验证和测试集中的幻觉信息。CT-Eval包含88.6K任务样本，旨在帮助研究人员评估和快速理解现有大型语言模型的中文文本到表格能力，并作为提升文本到表格性能的重要资源。

提供机构：

早稻田大学

创建时间：

2024-05-21

搜集汇总

数据集介绍