five

achintasandia/all_the_news_cnn_2018

收藏
Hugging Face2024-06-01 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/achintasandia/all_the_news_cnn_2018
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含多个特征,如日期、年份、月份、日、作者、标题、文章、URL、部分、出版物以及由Meta-Llama-3-70B-Instruct模型生成和清理的声明。数据集仅包含训练集,共有28,929个示例,占用239,531,723字节。下载大小为125,559,297字节,数据集大小为239,531,723字节。

该数据集包含多个特征,如日期、年份、月份、日、作者、标题、文章、URL、部分、出版物以及由Meta-Llama-3-70B-Instruct模型生成和清理的声明。数据集仅包含训练集,共有28,929个示例,占用239,531,723字节。下载大小为125,559,297字节,数据集大小为239,531,723字节。
提供机构:
achintasandia
原始信息汇总

数据集概述

许可证

  • Apache 2.0

数据集信息

特征

  • date: 类型为字符串 (string)
  • year: 类型为整数 (int64)
  • month: 类型为浮点数 (float64)
  • day: 类型为整数 (int64)
  • author: 类型为字符串 (string)
  • title: 类型为字符串 (string)
  • article: 类型为字符串 (string)
  • url: 类型为字符串 (string)
  • section: 类型为字符串 (string)
  • publication: 类型为字符串 (string)
  • generated_claims_Meta-Llama-3-70B-Instruct: 类型为字符串 (string)
  • cleaned_claims_Meta-Llama-3-70B-Instruct: 类型为字符串 (string)

数据分割

  • train: 包含28929个样本,占用239531723字节

数据集大小

  • 下载大小: 125559297字节
  • 数据集大小: 239531723字节

配置

  • config_name: default
    • data_files:
      • split: train
      • path: data/train-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作