Chrisneverdie/sports-annotation-outcome
收藏Hugging Face2024-06-17 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Chrisneverdie/sports-annotation-outcome
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
- config_name: nonsport_outcome
features:
- name: text
dtype: string
- name: url
dtype: string
- name: token_count
dtype: int64
- name: score
sequence: float64
- name: ypred
dtype: int64
splits:
- name: train
num_bytes: 184048238.06114507
num_examples: 57378
download_size: 109441117
dataset_size: 184048238.06114507
- config_name: test
features:
- name: text
dtype: string
- name: label
dtype: int64
- name: score
sequence: float64
- name: ypred
dtype: int64
splits:
- name: train
num_bytes: 27096931
num_examples: 8613
download_size: 16574246
dataset_size: 27096931
- config_name: test2
features:
- name: text
dtype: string
- name: label
dtype: int64
- name: score
sequence: float64
- name: ypred
dtype: int64
splits:
- name: train
num_bytes: 27096931
num_examples: 8613
download_size: 16573992
dataset_size: 27096931
- config_name: test_1
features:
- name: text
dtype: string
splits:
- name: train
num_bytes: 3249747166
num_examples: 1092000
download_size: 2032856810
dataset_size: 3249747166
- config_name: test_1000rows
features:
- name: text
dtype: string
splits:
- name: test
num_bytes: 419286.055
num_examples: 127
download_size: 246047
dataset_size: 419286.055
- config_name: test_1000rows_2
features:
- name: text
dtype: string
- name: ypred
dtype: int64
splits:
- name: test
num_bytes: 420302.055
num_examples: 127
download_size: 246558
dataset_size: 420302.055
- config_name: test_from_lcx
features:
- name: text
dtype: string
splits:
- name: train
num_bytes: 388502512.16099083
num_examples: 130547
download_size: 234506644
dataset_size: 388502512.16099083
configs:
- config_name: nonsport_outcome
data_files:
- split: train
path: nonsport_outcome/train-*
- config_name: test
data_files:
- split: train
path: test/train-*
- config_name: test2
data_files:
- split: train
path: test2/train-*
- config_name: test_1
data_files:
- split: train
path: test_1/train-*
- config_name: test_1000rows
data_files:
- split: test
path: test_1000rows/test-*
- config_name: test_1000rows_2
data_files:
- split: test
path: test_1000rows_2/test-*
- config_name: test_from_lcx
data_files:
- split: train
path: test_from_lcx/train-*
---
数据集信息:
1. 配置名称:nonsport_outcome
特征字段:
- 字段名:text,数据类型:字符串(string)
- 字段名:url,数据类型:字符串(string)
- 字段名:Token计数(token_count),数据类型:64位整数(int64)
- 字段名:score,数据类型:64位浮点数序列
- 字段名:ypred,数据类型:64位整数(int64)
数据集划分:
- 划分名称:训练集(train),字节数:184048238.06114507,样本数量:57378
下载总大小:109441117,数据集总存储大小:184048238.06114507
2. 配置名称:test
特征字段:
- 字段名:text,数据类型:字符串(string)
- 字段名:label,数据类型:64位整数(int64)
- 字段名:score,数据类型:64位浮点数序列
- 字段名:ypred,数据类型:64位整数(int64)
数据集划分:
- 划分名称:训练集(train),字节数:27096931,样本数量:8613
下载总大小:16574246,数据集总存储大小:27096931
3. 配置名称:test2
特征字段:
- 字段名:text,数据类型:字符串(string)
- 字段名:label,数据类型:64位整数(int64)
- 字段名:score,数据类型:64位浮点数序列
- 字段名:ypred,数据类型:64位整数(int64)
数据集划分:
- 划分名称:训练集(train),字节数:27096931,样本数量:8613
下载总大小:16573992,数据集总存储大小:27096931
4. 配置名称:test_1
特征字段:
- 字段名:text,数据类型:字符串(string)
数据集划分:
- 划分名称:训练集(train),字节数:3249747166,样本数量:1092000
下载总大小:2032856810,数据集总存储大小:3249747166
5. 配置名称:test_1000rows
特征字段:
- 字段名:text,数据类型:字符串(string)
数据集划分:
- 划分名称:测试集(test),字节数:419286.055,样本数量:127
下载总大小:246047,数据集总存储大小:419286.055
6. 配置名称:test_1000rows_2
特征字段:
- 字段名:text,数据类型:字符串(string)
- 字段名:ypred,数据类型:64位整数(int64)
数据集划分:
- 划分名称:测试集(test),字节数:420302.055,样本数量:127
下载总大小:246558,数据集总存储大小:420302.055
7. 配置名称:test_from_lcx
特征字段:
- 字段名:text,数据类型:字符串(string)
数据集划分:
- 划分名称:训练集(train),字节数:388502512.16099083,样本数量:130547
下载总大小:234506644,数据集总存储大小:388502512.16099083
各配置对应数据文件路径:
- 配置nonsport_outcome:数据文件划分对应训练集(train),路径为:nonsport_outcome/train-*
- 配置test:数据文件划分对应训练集(train),路径为:test/train-*
- 配置test2:数据文件划分对应训练集(train),路径为:test2/train-*
- 配置test_1:数据文件划分对应训练集(train),路径为:test_1/train-*
- 配置test_1000rows:数据文件划分对应测试集(test),路径为:test_1000rows/test-*
- 配置test_1000rows_2:数据文件划分对应测试集(test),路径为:test_1000rows_2/test-*
- 配置test_from_lcx:数据文件划分对应训练集(train),路径为:test_from_lcx/train-*
提供机构:
Chrisneverdie
原始信息汇总
数据集概述
数据集配置
- 配置名称: test
数据集特征
- text: 数据类型为字符串
- label: 数据类型为整数(int64)
- score: 数据类型为浮点数(float64),具有序列性
- ypred: 数据类型为整数(int64)
数据集分割
- 训练集(train):
- 示例数量: 8613
- 数据大小: 27096931字节
数据集大小
- 下载大小: 16577733字节
- 总数据大小: 27096931字节



