five

lonestar108/dwitter

收藏
Hugging Face2023-09-07 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/lonestar108/dwitter
下载链接
链接失效反馈
官方服务:
资源简介:
--- configs: - config_name: default data_files: - split: best_train path: data/best_train-* - split: best_valid path: data/best_valid-* - split: most_train path: data/most_train-* - split: most_valid path: data/most_valid-* - split: good_train path: data/good_train-* - split: good_valid path: data/good_valid-* - split: top_train path: data/top_train-* dataset_info: features: - name: text dtype: string splits: - name: best_train num_bytes: 80682 num_examples: 577 - name: best_valid num_bytes: 7190 num_examples: 52 - name: most_train num_bytes: 956260 num_examples: 7018 - name: most_valid num_bytes: 135422 num_examples: 994 - name: good_train num_bytes: 324996 num_examples: 2350 - name: good_valid num_bytes: 40160 num_examples: 290 - name: top_train num_bytes: 25101 num_examples: 178 download_size: 999167 dataset_size: 1569811 --- # Dataset Card for "dwitter" [More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
lonestar108
原始信息汇总

数据集概述

配置信息

  • 默认配置
    • 数据文件路径:
      • best_traindata/best_train-*
      • best_validdata/best_valid-*
      • most_traindata/most_train-*
      • most_validdata/most_valid-*
      • good_traindata/good_train-*
      • good_validdata/good_valid-*
      • top_traindata/top_train-*

数据集信息

  • 特征

    • text:数据类型为字符串(string)
  • 分割信息

    • best_train
      • 字节数:80682
      • 样本数:577
    • best_valid
      • 字节数:7190
      • 样本数:52
    • most_train
      • 字节数:956260
      • 样本数:7018
    • most_valid
      • 字节数:135422
      • 样本数:994
    • good_train
      • 字节数:324996
      • 样本数:2350
    • good_valid
      • 字节数:40160
      • 样本数:290
    • top_train
      • 字节数:25101
      • 样本数:178
  • 数据集大小

    • 下载大小:999167字节
    • 数据集大小:1569811字节
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作