five

vidore/syntheticDocQA_artificial_intelligence_test

收藏
Hugging Face2024-07-02 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/vidore/syntheticDocQA_artificial_intelligence_test
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个特定主题的检索基准,涵盖多个领域,评估在更现实的工业应用中的检索性能。它包括关于人工智能的文档。数据集包含1000个PDF文档的1000个随机页面,每个页面与100个问题和答案相关联,这些问题和答案是由Claude-3 Sonnet模型生成的。数据收集过程使用了网络爬虫和GPT-3.5 Turbo来扩展和深化搜索查询,确保收集到的文档相关性和多样性。数据整理过程中,人类注释者对生成的问题和答案进行了质量和相关性的过滤。

该数据集是一个特定主题的检索基准,涵盖多个领域,评估在更现实的工业应用中的检索性能。它包括关于人工智能的文档。数据集包含1000个PDF文档的1000个随机页面,每个页面与100个问题和答案相关联,这些问题和答案是由Claude-3 Sonnet模型生成的。数据收集过程使用了网络爬虫和GPT-3.5 Turbo来扩展和深化搜索查询,确保收集到的文档相关性和多样性。数据整理过程中,人类注释者对生成的问题和答案进行了质量和相关性的过滤。
提供机构:
vidore
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作