vidore/syntheticDocQA_artificial_intelligence_test
收藏Hugging Face2024-07-02 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/vidore/syntheticDocQA_artificial_intelligence_test
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个特定主题的检索基准,涵盖多个领域,评估在更现实的工业应用中的检索性能。它包括关于人工智能的文档。数据集包含1000个PDF文档的1000个随机页面,每个页面与100个问题和答案相关联,这些问题和答案是由Claude-3 Sonnet模型生成的。数据收集过程使用了网络爬虫和GPT-3.5 Turbo来扩展和深化搜索查询,确保收集到的文档相关性和多样性。数据整理过程中,人类注释者对生成的问题和答案进行了质量和相关性的过滤。
该数据集是一个特定主题的检索基准,涵盖多个领域,评估在更现实的工业应用中的检索性能。它包括关于人工智能的文档。数据集包含1000个PDF文档的1000个随机页面,每个页面与100个问题和答案相关联,这些问题和答案是由Claude-3 Sonnet模型生成的。数据收集过程使用了网络爬虫和GPT-3.5 Turbo来扩展和深化搜索查询,确保收集到的文档相关性和多样性。数据整理过程中,人类注释者对生成的问题和答案进行了质量和相关性的过滤。
提供机构:
vidore



