five

LCA-PORVID/gold_labelled

收藏
Hugging Face2024-02-12 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/LCA-PORVID/gold_labelled
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: - config_name: journalistic features: - name: text dtype: string - name: label dtype: int64 splits: - name: test num_bytes: 32648 num_examples: 36 download_size: 25682 dataset_size: 32648 - config_name: legal features: - name: text dtype: string - name: label dtype: int64 splits: - name: test num_bytes: 13540 num_examples: 37 download_size: 12093 dataset_size: 13540 - config_name: literature features: - name: text dtype: string - name: label dtype: int64 splits: - name: test num_bytes: 13133 num_examples: 36 download_size: 12717 dataset_size: 13133 - config_name: politics features: - name: text dtype: string - name: label dtype: int64 splits: - name: test num_bytes: 65137 num_examples: 48 download_size: 47084 dataset_size: 65137 - config_name: social_media features: - name: text dtype: string - name: label dtype: int64 splits: - name: test num_bytes: 6232 num_examples: 28 download_size: 6318 dataset_size: 6232 - config_name: web features: - name: text dtype: string - name: label dtype: int64 splits: - name: test num_bytes: 68724 num_examples: 34 download_size: 48413 dataset_size: 68724 configs: - config_name: journalistic data_files: - split: test path: journalistic/test-* - config_name: legal data_files: - split: test path: legal/test-* - config_name: literature data_files: - split: test path: literature/test-* - config_name: politics data_files: - split: test path: politics/test-* - config_name: social_media data_files: - split: test path: social_media/test-* - config_name: web data_files: - split: test path: web/test-* ---
提供机构:
LCA-PORVID
原始信息汇总

数据集概述

数据集配置

新闻(journalistic)

  • 特征
    • text:字符串类型
    • label:64位整数类型
  • 分割
    • test:32648字节,36个样本
  • 下载大小:25682字节
  • 数据集大小:32648字节
  • 数据文件路径:journalistic/test-*

法律(legal)

  • 特征
    • text:字符串类型
    • label:64位整数类型
  • 分割
    • test:13540字节,37个样本
  • 下载大小:12093字节
  • 数据集大小:13540字节
  • 数据文件路径:legal/test-*

文学(literature)

  • 特征
    • text:字符串类型
    • label:64位整数类型
  • 分割
    • test:13133字节,36个样本
  • 下载大小:12717字节
  • 数据集大小:13133字节
  • 数据文件路径:literature/test-*

政治(politics)

  • 特征
    • text:字符串类型
    • label:64位整数类型
  • 分割
    • test:65137字节,48个样本
  • 下载大小:47084字节
  • 数据集大小:65137字节
  • 数据文件路径:politics/test-*

社交媒体(social_media)

  • 特征
    • text:字符串类型
    • label:64位整数类型
  • 分割
    • test:6232字节,28个样本
  • 下载大小:6318字节
  • 数据集大小:6232字节
  • 数据文件路径:social_media/test-*

网络(web)

  • 特征
    • text:字符串类型
    • label:64位整数类型
  • 分割
    • test:68724字节,34个样本
  • 下载大小:48413字节
  • 数据集大小:68724字节
  • 数据文件路径:web/test-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作