five

Chrisneverdie/sports-annotation-outcome

收藏
Hugging Face2024-06-17 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Chrisneverdie/sports-annotation-outcome
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: - config_name: nonsport_outcome features: - name: text dtype: string - name: url dtype: string - name: token_count dtype: int64 - name: score sequence: float64 - name: ypred dtype: int64 splits: - name: train num_bytes: 184048238.06114507 num_examples: 57378 download_size: 109441117 dataset_size: 184048238.06114507 - config_name: test features: - name: text dtype: string - name: label dtype: int64 - name: score sequence: float64 - name: ypred dtype: int64 splits: - name: train num_bytes: 27096931 num_examples: 8613 download_size: 16574246 dataset_size: 27096931 - config_name: test2 features: - name: text dtype: string - name: label dtype: int64 - name: score sequence: float64 - name: ypred dtype: int64 splits: - name: train num_bytes: 27096931 num_examples: 8613 download_size: 16573992 dataset_size: 27096931 - config_name: test_1 features: - name: text dtype: string splits: - name: train num_bytes: 3249747166 num_examples: 1092000 download_size: 2032856810 dataset_size: 3249747166 - config_name: test_1000rows features: - name: text dtype: string splits: - name: test num_bytes: 419286.055 num_examples: 127 download_size: 246047 dataset_size: 419286.055 - config_name: test_1000rows_2 features: - name: text dtype: string - name: ypred dtype: int64 splits: - name: test num_bytes: 420302.055 num_examples: 127 download_size: 246558 dataset_size: 420302.055 - config_name: test_from_lcx features: - name: text dtype: string splits: - name: train num_bytes: 388502512.16099083 num_examples: 130547 download_size: 234506644 dataset_size: 388502512.16099083 configs: - config_name: nonsport_outcome data_files: - split: train path: nonsport_outcome/train-* - config_name: test data_files: - split: train path: test/train-* - config_name: test2 data_files: - split: train path: test2/train-* - config_name: test_1 data_files: - split: train path: test_1/train-* - config_name: test_1000rows data_files: - split: test path: test_1000rows/test-* - config_name: test_1000rows_2 data_files: - split: test path: test_1000rows_2/test-* - config_name: test_from_lcx data_files: - split: train path: test_from_lcx/train-* ---

数据集信息: 1. 配置名称:nonsport_outcome 特征字段: - 字段名:text,数据类型:字符串(string) - 字段名:url,数据类型:字符串(string) - 字段名:Token计数(token_count),数据类型:64位整数(int64) - 字段名:score,数据类型:64位浮点数序列 - 字段名:ypred,数据类型:64位整数(int64) 数据集划分: - 划分名称:训练集(train),字节数:184048238.06114507,样本数量:57378 下载总大小:109441117,数据集总存储大小:184048238.06114507 2. 配置名称:test 特征字段: - 字段名:text,数据类型:字符串(string) - 字段名:label,数据类型:64位整数(int64) - 字段名:score,数据类型:64位浮点数序列 - 字段名:ypred,数据类型:64位整数(int64) 数据集划分: - 划分名称:训练集(train),字节数:27096931,样本数量:8613 下载总大小:16574246,数据集总存储大小:27096931 3. 配置名称:test2 特征字段: - 字段名:text,数据类型:字符串(string) - 字段名:label,数据类型:64位整数(int64) - 字段名:score,数据类型:64位浮点数序列 - 字段名:ypred,数据类型:64位整数(int64) 数据集划分: - 划分名称:训练集(train),字节数:27096931,样本数量:8613 下载总大小:16573992,数据集总存储大小:27096931 4. 配置名称:test_1 特征字段: - 字段名:text,数据类型:字符串(string) 数据集划分: - 划分名称:训练集(train),字节数:3249747166,样本数量:1092000 下载总大小:2032856810,数据集总存储大小:3249747166 5. 配置名称:test_1000rows 特征字段: - 字段名:text,数据类型:字符串(string) 数据集划分: - 划分名称:测试集(test),字节数:419286.055,样本数量:127 下载总大小:246047,数据集总存储大小:419286.055 6. 配置名称:test_1000rows_2 特征字段: - 字段名:text,数据类型:字符串(string) - 字段名:ypred,数据类型:64位整数(int64) 数据集划分: - 划分名称:测试集(test),字节数:420302.055,样本数量:127 下载总大小:246558,数据集总存储大小:420302.055 7. 配置名称:test_from_lcx 特征字段: - 字段名:text,数据类型:字符串(string) 数据集划分: - 划分名称:训练集(train),字节数:388502512.16099083,样本数量:130547 下载总大小:234506644,数据集总存储大小:388502512.16099083 各配置对应数据文件路径: - 配置nonsport_outcome:数据文件划分对应训练集(train),路径为:nonsport_outcome/train-* - 配置test:数据文件划分对应训练集(train),路径为:test/train-* - 配置test2:数据文件划分对应训练集(train),路径为:test2/train-* - 配置test_1:数据文件划分对应训练集(train),路径为:test_1/train-* - 配置test_1000rows:数据文件划分对应测试集(test),路径为:test_1000rows/test-* - 配置test_1000rows_2:数据文件划分对应测试集(test),路径为:test_1000rows_2/test-* - 配置test_from_lcx:数据文件划分对应训练集(train),路径为:test_from_lcx/train-*
提供机构:
Chrisneverdie
原始信息汇总

数据集概述

数据集配置

  • 配置名称: test

数据集特征

  • text: 数据类型为字符串
  • label: 数据类型为整数(int64)
  • score: 数据类型为浮点数(float64),具有序列性
  • ypred: 数据类型为整数(int64)

数据集分割

  • 训练集(train):
    • 示例数量: 8613
    • 数据大小: 27096931字节

数据集大小

  • 下载大小: 16577733字节
  • 总数据大小: 27096931字节
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作