five

CT-Eval

收藏
arXiv2024-05-21 更新2024-08-06 收录
下载链接:
http://arxiv.org/abs/2405.12174v1
下载链接
链接失效反馈
官方服务:
资源简介:
CT-Eval是一个专为评估大型语言模型在中文文本到表格任务上性能而设计的数据集。该数据集由早稻田大学创建,涵盖了28个不同领域,确保了数据的多样性。数据集的构建过程中,首先从百度百科这一流行的中文多学科在线百科中收集文档-表格对,然后使用大型语言模型作为幻觉判断器,过滤掉含有幻觉的任务样本,最后通过人工标注者进一步清理验证和测试集中的幻觉信息。CT-Eval包含88.6K任务样本,旨在帮助研究人员评估和快速理解现有大型语言模型的中文文本到表格能力,并作为提升文本到表格性能的重要资源。
提供机构:
早稻田大学
创建时间:
2024-05-21
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
CT-Eval是一个由早稻田大学创建的中文文本到表格评估数据集,涵盖28个领域以确保数据多样性。它通过从百度百科收集文档-表格对,并利用大型语言模型和人工标注过滤幻觉样本,包含88.6K任务样本,旨在帮助研究人员评估和提升大型语言模型的中文文本到表格能力。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作