nbalepur/doc_conflict_summary_split_chunked
收藏Hugging Face2024-06-24 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/nbalepur/doc_conflict_summary_split_chunked
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个特征,如查询(query)、文档URLs(doc_urls)、文档立场(doc_stances)和文档文本(doc_texts)。数据集被分割为多个部分,包括ConflictingQA、Debatepedia和DiverseSumm的训练和测试集,每个部分都有相应的字节大小和示例数量。数据集的总大小为83,104,505字节,下载大小为45,489,946字节。
The dataset includes multiple features such as query, document URLs (doc_urls), document stances (doc_stances), and document texts (doc_texts). It is divided into several parts, including training and test sets for ConflictingQA, Debatepedia, and DiverseSumm, each with corresponding byte sizes and example counts. The total size of the dataset is 83,104,505 bytes, with a download size of 45,489,946 bytes.
提供机构:
nbalepur
原始信息汇总
数据集概述
数据集特征
- query: 类型为字符串。
- doc_urls: 类型为字符串序列。
- doc_stances: 类型为字符串序列。
- doc_texts: 类型为字符串序列的序列。
数据集分割
- ConflictingQA_train: 包含5个样本,占用697576字节。
- ConflictingQA_test: 包含285个样本,占用39704296字节。
- Debatepedia_train: 包含5个样本,占用470298字节。
- Debatepedia_test: 包含178个样本,占用15006467字节。
- DiverseSumm_train: 包含5个样本,占用210482字节。
- DiverseSumm_test: 包含606个样本,占用27015386字节。
数据集大小
- 下载大小: 45489946字节。
- 总大小: 83104505字节。
配置
- default: 包含以下数据文件路径:
- ConflictingQA_train:
data/ConflictingQA_train-* - ConflictingQA_test:
data/ConflictingQA_test-* - Debatepedia_train:
data/Debatepedia_train-* - Debatepedia_test:
data/Debatepedia_test-* - DiverseSumm_train:
data/DiverseSumm_train-* - DiverseSumm_test:
data/DiverseSumm_test-*
- ConflictingQA_train:



