five

UGEN-V1

收藏
arXiv2023-08-08 更新2024-06-21 收录
下载链接:
https://github.com/northeastern-datalab/alt-gen
下载链接
链接失效反馈
官方服务:
资源简介:
UGEN-V1数据集是由东北大学的研究团队利用生成式AI模型创建的,用于表格联合搜索任务的基准数据集。该数据集包含1050个表格,覆盖50个不同主题,如世界地理、艺术史、家谱和兽医学等。数据集中的表格被分为可联合和不可联合两类,每类各500对,旨在通过详细的标注和多样化的主题,提供一个更具挑战性和现实性的测试平台,以评估和推动表格联合搜索技术的发展。此外,数据集还允许用户控制数据的不完整性(如空值比例),以进一步分析搜索方法在不同条件下的表现。
提供机构:
东北大学
创建时间:
2023-08-08
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作