kgr123/quality_counter_2048_4_uniq
收藏Hugging Face2024-02-14 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/kgr123/quality_counter_2048_4_uniq
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: context
dtype: string
- name: word
dtype: string
- name: claim
dtype: string
- name: label
dtype: int64
splits:
- name: train
num_bytes: 557027166
num_examples: 20000
- name: validation
num_bytes: 226226606
num_examples: 8000
- name: test
num_bytes: 56238220
num_examples: 2300
download_size: 26618603
dataset_size: 839491992
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: validation
path: data/validation-*
- split: test
path: data/test-*
---
数据集信息:
特征集:
- 字段名:上下文(context),数据类型:字符串
- 字段名:单词(word),数据类型:字符串
- 字段名:断言(claim),数据类型:字符串
- 字段名:标签(label),数据类型:64位整数(int64)
数据集划分:
- 划分名称:训练集(train),字节数:557027166,样本数量:20000
- 划分名称:验证集(validation),字节数:226226606,样本数量:8000
- 划分名称:测试集(test),字节数:56238220,样本数量:2300
下载总大小:26618603 字节
数据集总大小:839491992 字节
配置项:
- 配置名称:默认配置(default),数据文件路径:
- 训练集(train):data/train-*
- 验证集(validation):data/validation-*
- 测试集(test):data/test-*
提供机构:
kgr123
原始信息汇总
数据集概述
数据集特征
- context: 数据类型为字符串(string)
- word: 数据类型为字符串(string)
- claim: 数据类型为字符串(string)
- label: 数据类型为整数(int64)
数据集分割
- train: 包含20000个样本,大小为557027166字节
- validation: 包含8000个样本,大小为226226606字节
- test: 包含2300个样本,大小为56238220字节
数据集大小
- 下载大小: 26618603字节
- 数据集总大小: 839491992字节
配置信息
- 配置名称: default
- 数据文件路径:
- train: data/train-*
- validation: data/validation-*
- test: data/test-*



