UGEN-V1
收藏arXiv2023-08-08 更新2024-06-21 收录
下载链接:
https://github.com/northeastern-datalab/alt-gen
下载链接
链接失效反馈官方服务:
资源简介:
UGEN-V1数据集是由东北大学的研究团队利用生成式AI模型创建的,用于表格联合搜索任务的基准数据集。该数据集包含1050个表格,覆盖50个不同主题,如世界地理、艺术史、家谱和兽医学等。数据集中的表格被分为可联合和不可联合两类,每类各500对,旨在通过详细的标注和多样化的主题,提供一个更具挑战性和现实性的测试平台,以评估和推动表格联合搜索技术的发展。此外,数据集还允许用户控制数据的不完整性(如空值比例),以进一步分析搜索方法在不同条件下的表现。
提供机构:
东北大学
创建时间:
2023-08-08



