nbalepur/doc_conflict_summary
收藏Hugging Face2024-06-18 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/nbalepur/doc_conflict_summary
下载链接
链接失效反馈官方服务:
资源简介:
该数据集由三个主要部分组成:ConflictingQA、Debatepedia和DiverseSumm。每个部分包含不同数量的示例和字节大小。数据集的特征包括查询(query)、文档URLs(doc_urls)、文档立场(doc_stances)和文档文本(doc_texts)。这些特征都是字符串类型,其中文档文本是一个字符串序列的序列。
The dataset consists of three main parts: ConflictingQA, Debatepedia, and DiverseSumm. Each part contains a different number of examples and byte sizes. The features of the dataset include query, document URLs (doc_urls), document stances (doc_stances), and document texts (doc_texts). These features are all of string type, with document texts being a sequence of string sequences.
提供机构:
nbalepur
原始信息汇总
数据集概述
数据集特征
- query: 数据类型为字符串。
- doc_urls: 数据类型为字符串序列。
- doc_stances: 数据类型为字符串序列。
- doc_texts: 数据类型为字符串序列的序列。
数据集分割
- ConflictingQA:
- 字节数: 55246795
- 样本数: 434
- Debatepedia:
- 字节数: 15517284
- 样本数: 183
- DiverseSumm:
- 字节数: 27225868
- 样本数: 611
数据集大小
- 下载大小: 50897230 字节
- 数据集总大小: 97989947 字节
配置
- config_name: default
- data_files:
- ConflictingQA: 路径为
data/ConflictingQA-* - Debatepedia: 路径为
data/Debatepedia-* - DiverseSumm: 路径为
data/DiverseSumm-*
- ConflictingQA: 路径为
- data_files:



