chenghao/NEWS-COPY-train
收藏Hugging Face2024-03-18 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/chenghao/NEWS-COPY-train
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含NEWS COPY数据集的训练集,原始来源可以在Github上找到。数据集包含历史报纸数据。评估数据集可以在chenghao/NEWS-COPY-eval找到。
该数据集包含NEWS COPY数据集的训练集,原始来源可以在Github上找到。数据集包含历史报纸数据。评估数据集可以在chenghao/NEWS-COPY-eval找到。
提供机构:
chenghao
原始信息汇总
数据集概述
数据集特征
- Text 1: 数据类型为字符串。
- Text 2: 数据类型为字符串。
- Label: 数据类型为字符串。
- split: 数据类型为字符串。
数据集分割
- 训练集 (train): 包含73928个样本,总大小为285532211字节。
- 验证集 (dev): 包含6288个样本,总大小为18222482字节。
数据集大小
- 下载大小: 131881405字节。
- 数据集总大小: 303754693字节。
配置文件
- 默认配置 (default):
- 训练集路径:
data/train-* - 验证集路径:
data/dev-*
- 训练集路径:
许可证
- 许可证信息: 未知。



