achintasandia/all_the_news_cnn_2018
收藏Hugging Face2024-06-01 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/achintasandia/all_the_news_cnn_2018
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个特征,如日期、年份、月份、日、作者、标题、文章、URL、部分、出版物以及由Meta-Llama-3-70B-Instruct模型生成和清理的声明。数据集仅包含训练集,共有28,929个示例,占用239,531,723字节。下载大小为125,559,297字节,数据集大小为239,531,723字节。
该数据集包含多个特征,如日期、年份、月份、日、作者、标题、文章、URL、部分、出版物以及由Meta-Llama-3-70B-Instruct模型生成和清理的声明。数据集仅包含训练集,共有28,929个示例,占用239,531,723字节。下载大小为125,559,297字节,数据集大小为239,531,723字节。
提供机构:
achintasandia
原始信息汇总
数据集概述
许可证
- Apache 2.0
数据集信息
特征
- date: 类型为字符串 (string)
- year: 类型为整数 (int64)
- month: 类型为浮点数 (float64)
- day: 类型为整数 (int64)
- author: 类型为字符串 (string)
- title: 类型为字符串 (string)
- article: 类型为字符串 (string)
- url: 类型为字符串 (string)
- section: 类型为字符串 (string)
- publication: 类型为字符串 (string)
- generated_claims_Meta-Llama-3-70B-Instruct: 类型为字符串 (string)
- cleaned_claims_Meta-Llama-3-70B-Instruct: 类型为字符串 (string)
数据分割
- train: 包含28929个样本,占用239531723字节
数据集大小
- 下载大小: 125559297字节
- 数据集大小: 239531723字节
配置
- config_name: default
- data_files:
- split: train
- path: data/train-*
- data_files:



