GenAISearch_Data

github2025-03-05 更新2025-03-17 收录

下载链接：

https://github.com/TowCenter/genSearch-Part2

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含了对八种生成式搜索工具的系统测试结果，测试了20家新闻出版商的文章，并手动选择了直接摘录用于查询。数据集包含了技术平台、出版物、出版商与AI公司的关系、爬虫权限、文章日期、付费墙状态、源URL、查询提示、提示编号、聊天机器人的回答、回答中的出版商、引用链接、列出的日期、置信度、与原始内容的接近度、是否正确识别文章、是否正确识别出版商、是否正确识别日期、是否正确引用URL等字段。

This dataset comprises systematic test results of eight generative search tools, which were evaluated using articles from 20 news publishers, with queries manually curated from direct excerpts of the target articles. The dataset includes the following fields: technical platform, publication, relationship between the publisher and AI companies, crawler permissions, article publication date, paywall status, source URL, query prompt, prompt ID, chatbot responses, publisher referenced in the responses, cited links, listed date, confidence score, proximity to the original content, whether the article was correctly identified, whether the publisher was correctly identified, whether the article's publication date was correctly identified, and whether the URL was correctly cited.

创建时间：

2025-03-05

搜集汇总

数据集介绍

构建方式

GenAISearch_Data数据集的构建采取了系统化的测试方法，针对八款生成式搜索工具进行了评估。研究团队从20个新闻发布商中选取了立场各异的样本，通过随机选择文章并提取直接摘要作为查询，以评估这些工具在检索文章标题、原始发布商、发布日期和URL方面的准确性。

使用方法

使用GenAISearch_Data数据集时，用户首先需要克隆仓库并解密数据文件。之后，可以提取数据集内容，并利用其中的信息来分析生成式搜索工具的性能，包括正确检索文章、识别发布商、检索发布日期和URL的能力。数据集的结构化字段使得自动化处理和评估成为可能。

背景与挑战

背景概述

GenAISearch_Data数据集是在人工智能搜索工具性能评估领域的一项重要研究成果。该数据集由研究人员在评估不同生成式搜索工具对新闻文章搜索表现的过程中创建，旨在探索和评估这些工具在信息检索方面的准确性。该数据集的创建时间为近期，由专业的科研团队负责实施，主要针对生成式搜索工具在新闻内容检索上的表现进行系统性测试。数据集的核心研究问题聚焦于搜索工具能否准确识别新闻文章的标题、来源、发布日期和URL。由于其创新性和研究价值，该数据集对信息检索和自然语言处理领域产生了显著影响。

当前挑战

GenAISearch_Data数据集在构建过程中面临的挑战主要包括：确保所选新闻文章的代表性，以涵盖不同立场和对待AI的态度；在遵守网站机器人排除标准（robots.txt）的前提下，合法合规地获取数据；以及设计有效的查询方式，以评估搜索工具的准确性。此外，在研究领域中，该数据集所解决的挑战是如何准确评价生成式搜索工具在实际应用场景下的性能，以及如何量化其检索结果与原始内容之间的相关性。

常用场景

经典使用场景

GenAISearch_Data数据集的典型应用场景在于评估生成式搜索工具在新闻文章检索方面的表现。该数据集包含多个新闻发布商的 articles 摘录，以及针对这些摘录设计的查询，用于测试包括OpenAI的ChatGPT Search、Perplexity、Microsoft的Copilot等在内的多种生成式搜索工具在检索准确性和信息完整性方面的能力。

解决学术问题

该数据集解决了如何量化生成式搜索工具在新闻检索任务中的性能问题，为学术研究提供了关于搜索工具准确性和效率的实证数据。通过分析不同工具在正确检索文章标题、发布者、发布日期和URL方面的表现，研究者能够深入了解这些工具的优劣，进一步指导搜索算法的优化。

实际应用

数据集最近研究