ghomasHudson/vlsp
收藏Hugging Face2022-10-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ghomasHudson/vlsp
下载链接
链接失效反馈官方服务:
资源简介:
该数据集遵循scientific_papers数据集的方法,但专门设计用于处理非常长的文档(>10,000字)。这些文档是从arxiv.org上搜索论文收集的。数据集包含两个特征:文章正文和摘要。数据集支持的任务是摘要生成,语言为英语。
提供机构:
ghomasHudson
原始信息汇总
数据集概述
数据集描述
数据集总结
- 该数据集遵循科学论文数据集的方法论,专门设计用于处理非常长的文档(超过10,000字)。数据来源于arxiv.org,通过搜索论文获得。
- 数据集包含2个特征:
article: 文档的主体部分。abstract: 文档的摘要部分。
支持的任务和排行榜
- 任务:摘要生成
语言
- 语言:英语
数据集结构
数据实例
- 信息缺失
数据字段
- 信息缺失
数据分割
- 仅提供测试集
数据集创建
数据收集和规范化
- 信息缺失
源语言生产者
- 信息缺失
注释
- 信息缺失
个人和敏感信息
- 信息缺失
使用数据的考虑因素
数据集的社会影响
- 信息缺失
偏见讨论
- 信息缺失
其他已知限制
- 信息缺失
附加信息
数据集管理者
- 信息缺失
许可信息
- 信息缺失
引用信息
- 信息缺失



