five

joshuapsa/gpt-generated-news-paragraphs-v1.0

收藏
Hugging Face2023-11-16 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/joshuapsa/gpt-generated-news-paragraphs-v1.0
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: class_index dtype: class_label: names: '0': '0' '1': '1' - name: text dtype: string - name: aviation dtype: class_label: names: '0': '0' '1': '1' - name: cybersecurity dtype: class_label: names: '0': '0' '1': '1' - name: domestic_unrest_violence dtype: class_label: names: '0': '0' '1': '1' - name: extreme_weather dtype: class_label: names: '0': '0' '1': '1' - name: forced_labor dtype: class_label: names: '0': '0' '1': '1' - name: general_biz_trend dtype: class_label: names: '0': '0' '1': '1' - name: individual_accidents_tragedies dtype: class_label: names: '0': '0' '1': '1' - name: later_report dtype: class_label: names: '0': '0' '1': '1' - name: lawsuit_legal_insurance dtype: class_label: names: '0': '0' '1': '1' - name: leisure_other_news dtype: class_label: names: '0': '0' '1': '1' - name: maritime dtype: class_label: names: '0': '0' '1': '1' - name: pandemics_large_scale_diseases dtype: class_label: names: '0': '0' '1': '1' - name: railway dtype: class_label: names: '0': '0' '1': '1' - name: strike dtype: class_label: names: '0': '0' '1': '1' - name: trade_war_embargos_bans dtype: class_label: names: '0': '0' '1': '1' - name: transportation_trends_projects dtype: class_label: names: '0': '0' '1': '1' - name: war_conflict dtype: class_label: names: '0': '0' '1': '1' - name: warehouse_fire dtype: class_label: names: '0': '0' '1': '1' - name: labels sequence: int64 splits: - name: train num_bytes: 303623 num_examples: 540 - name: valid num_bytes: 101197 num_examples: 180 - name: test num_bytes: 100901 num_examples: 180 download_size: 177940 dataset_size: 505721 --- # Dataset Card for "gpt-generated-news-paragraphs" [More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
joshuapsa
原始信息汇总

数据集概述

特征信息

  • class_index: 类别索引,数据类型为类别标签,标签名称为 0 和 1。
  • text: 文本内容,数据类型为字符串。
  • aviation: 航空类别,数据类型为类别标签,标签名称为 0 和 1。
  • cybersecurity: 网络安全类别,数据类型为类别标签,标签名称为 0 和 1。
  • domestic_unrest_violence: 国内不安与暴力类别,数据类型为类别标签,标签名称为 0 和 1。
  • extreme_weather: 极端天气类别,数据类型为类别标签,标签名称为 0 和 1。
  • forced_labor: 强迫劳动类别,数据类型为类别标签,标签名称为 0 和 1。
  • general_biz_trend: 一般商业趋势类别,数据类型为类别标签,标签名称为 0 和 1。
  • individual_accidents_tragedies: 个人事故与悲剧类别,数据类型为类别标签,标签名称为 0 和 1。
  • later_report: 后续报道类别,数据类型为类别标签,标签名称为 0 和 1。
  • lawsuit_legal_insurance: 诉讼、法律与保险类别,数据类型为类别标签,标签名称为 0 和 1。
  • leisure_other_news: 休闲与其他新闻类别,数据类型为类别标签,标签名称为 0 和 1。
  • maritime: 海事类别,数据类型为类别标签,标签名称为 0 和 1。
  • pandemics_large_scale_diseases: 大流行病与大规模疾病类别,数据类型为类别标签,标签名称为 0 和 1。
  • railway: 铁路类别,数据类型为类别标签,标签名称为 0 和 1。
  • strike: 罢工类别,数据类型为类别标签,标签名称为 0 和 1。
  • trade_war_embargos_bans: 贸易战、禁运与禁令类别,数据类型为类别标签,标签名称为 0 和 1。
  • transportation_trends_projects: 运输趋势与项目类别,数据类型为类别标签,标签名称为 0 和 1。
  • war_conflict: 战争与冲突类别,数据类型为类别标签,标签名称为 0 和 1。
  • warehouse_fire: 仓库火灾类别,数据类型为类别标签,标签名称为 0 和 1。
  • labels: 标签,数据类型为整数序列。

数据分割

  • train: 训练集,包含 540 个样本,大小为 303623 字节。
  • valid: 验证集,包含 180 个样本,大小为 101197 字节。
  • test: 测试集,包含 180 个样本,大小为 100901 字节。

数据集大小

  • 下载大小: 177940 字节
  • 数据集大小: 505721 字节
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作