joshuapsa/gpt-generated-news-paragraphs-v1.0
收藏Hugging Face2023-11-16 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/joshuapsa/gpt-generated-news-paragraphs-v1.0
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: class_index
dtype:
class_label:
names:
'0': '0'
'1': '1'
- name: text
dtype: string
- name: aviation
dtype:
class_label:
names:
'0': '0'
'1': '1'
- name: cybersecurity
dtype:
class_label:
names:
'0': '0'
'1': '1'
- name: domestic_unrest_violence
dtype:
class_label:
names:
'0': '0'
'1': '1'
- name: extreme_weather
dtype:
class_label:
names:
'0': '0'
'1': '1'
- name: forced_labor
dtype:
class_label:
names:
'0': '0'
'1': '1'
- name: general_biz_trend
dtype:
class_label:
names:
'0': '0'
'1': '1'
- name: individual_accidents_tragedies
dtype:
class_label:
names:
'0': '0'
'1': '1'
- name: later_report
dtype:
class_label:
names:
'0': '0'
'1': '1'
- name: lawsuit_legal_insurance
dtype:
class_label:
names:
'0': '0'
'1': '1'
- name: leisure_other_news
dtype:
class_label:
names:
'0': '0'
'1': '1'
- name: maritime
dtype:
class_label:
names:
'0': '0'
'1': '1'
- name: pandemics_large_scale_diseases
dtype:
class_label:
names:
'0': '0'
'1': '1'
- name: railway
dtype:
class_label:
names:
'0': '0'
'1': '1'
- name: strike
dtype:
class_label:
names:
'0': '0'
'1': '1'
- name: trade_war_embargos_bans
dtype:
class_label:
names:
'0': '0'
'1': '1'
- name: transportation_trends_projects
dtype:
class_label:
names:
'0': '0'
'1': '1'
- name: war_conflict
dtype:
class_label:
names:
'0': '0'
'1': '1'
- name: warehouse_fire
dtype:
class_label:
names:
'0': '0'
'1': '1'
- name: labels
sequence: int64
splits:
- name: train
num_bytes: 303623
num_examples: 540
- name: valid
num_bytes: 101197
num_examples: 180
- name: test
num_bytes: 100901
num_examples: 180
download_size: 177940
dataset_size: 505721
---
# Dataset Card for "gpt-generated-news-paragraphs"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
joshuapsa
原始信息汇总
数据集概述
特征信息
- class_index: 类别索引,数据类型为类别标签,标签名称为 0 和 1。
- text: 文本内容,数据类型为字符串。
- aviation: 航空类别,数据类型为类别标签,标签名称为 0 和 1。
- cybersecurity: 网络安全类别,数据类型为类别标签,标签名称为 0 和 1。
- domestic_unrest_violence: 国内不安与暴力类别,数据类型为类别标签,标签名称为 0 和 1。
- extreme_weather: 极端天气类别,数据类型为类别标签,标签名称为 0 和 1。
- forced_labor: 强迫劳动类别,数据类型为类别标签,标签名称为 0 和 1。
- general_biz_trend: 一般商业趋势类别,数据类型为类别标签,标签名称为 0 和 1。
- individual_accidents_tragedies: 个人事故与悲剧类别,数据类型为类别标签,标签名称为 0 和 1。
- later_report: 后续报道类别,数据类型为类别标签,标签名称为 0 和 1。
- lawsuit_legal_insurance: 诉讼、法律与保险类别,数据类型为类别标签,标签名称为 0 和 1。
- leisure_other_news: 休闲与其他新闻类别,数据类型为类别标签,标签名称为 0 和 1。
- maritime: 海事类别,数据类型为类别标签,标签名称为 0 和 1。
- pandemics_large_scale_diseases: 大流行病与大规模疾病类别,数据类型为类别标签,标签名称为 0 和 1。
- railway: 铁路类别,数据类型为类别标签,标签名称为 0 和 1。
- strike: 罢工类别,数据类型为类别标签,标签名称为 0 和 1。
- trade_war_embargos_bans: 贸易战、禁运与禁令类别,数据类型为类别标签,标签名称为 0 和 1。
- transportation_trends_projects: 运输趋势与项目类别,数据类型为类别标签,标签名称为 0 和 1。
- war_conflict: 战争与冲突类别,数据类型为类别标签,标签名称为 0 和 1。
- warehouse_fire: 仓库火灾类别,数据类型为类别标签,标签名称为 0 和 1。
- labels: 标签,数据类型为整数序列。
数据分割
- train: 训练集,包含 540 个样本,大小为 303623 字节。
- valid: 验证集,包含 180 个样本,大小为 101197 字节。
- test: 测试集,包含 180 个样本,大小为 100901 字节。
数据集大小
- 下载大小: 177940 字节
- 数据集大小: 505721 字节



