five

seonglae/data-rtsum

收藏
Hugging Face2023-07-19 更新2024-05-25 收录
下载链接:
https://hf-mirror.com/datasets/seonglae/data-rtsum
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集由AutoTrain自动处理生成,用于自动摘要任务。数据集包含文本和目标摘要两个字段,数据被分为训练集和验证集。样本展示了从原始文本到目标摘要的转换过程。
提供机构:
seonglae
原始信息汇总

AutoTrain Dataset for project: sjyyj

数据集描述

本数据集是为项目sjyyj自动处理生成的。

语言

数据集的语言BCP-47代码为unk。

数据集结构

数据实例

数据集的样本示例如下:

json [ { "text": "<subject>my characterizations of Peggy<predicate>changed<object>much <subject>I<predicate>ca nt say<object>my characterizations of Peggy necessarily changed much", "target": "I cant say my characterizations of Peggy necessarily changed much." }, { "text": "<subject>The Pakistani Taliban<predicate>has claimed<object>responsibility for two of those attacks <subject>The Pakistani Taliban has claimed responsibility for two of those attacks<predicate>told<object>CNN Monday", "target": "The Pakistani Taliban has claimed responsibility for two of those attacks, a central spokesman for the militant group told CNN by telephone Monday." } ]

数据集字段

数据集包含以下字段(也称为“特征”):

json { "text": "Value(dtype=string, id=None)", "target": "Value(dtype=string, id=None)" }

数据集分割

数据集被分割为训练集和验证集,分割大小如下:

分割名称 样本数量
训练集 822220
验证集 205556
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作