mhr2004/wikineg-train
收藏Hugging Face2024-05-06 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/mhr2004/wikineg-train
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: dataid
dtype: int32
- name: articleid
dtype: int32
- name: sent
dtype: string
- name: reverse
dtype: string
- name: prev
dtype: string
- name: prev2
dtype: string
- name: next
dtype: string
- name: next2
dtype: string
splits:
- name: affir
num_bytes: 2431421700
num_examples: 3185146
- name: neg
num_bytes: 2876785622
num_examples: 3185146
download_size: 3738923162
dataset_size: 5308207322
configs:
- config_name: default
data_files:
- split: affir
path: data/affir-*
- split: neg
path: data/neg-*
---
数据集信息:
特征字段:
- 名称:数据ID(dataid),数据类型:int32
- 名称:文章ID(articleid),数据类型:int32
- 名称:句子(sent),数据类型:字符串(string)
- 名称:反转文本(reverse),数据类型:字符串(string)
- 名称:前一句(prev),数据类型:字符串(string)
- 名称:前两句(prev2),数据类型:字符串(string)
- 名称:后一句(next),数据类型:字符串(string)
- 名称:后两句(next2),数据类型:字符串(string)
数据划分:
- 划分名称:肯定集(affir),占用字节数:2431421700,样本数量:3185146
- 划分名称:否定集(neg),占用字节数:2876785622,样本数量:3185146
下载总大小:3738923162
数据集总存储大小:5308207322
数据集配置:
- 配置名称:默认(default),数据文件:
- 划分:肯定集(affir),文件路径:data/affir-*
- 划分:否定集(neg),文件路径:data/neg-*
提供机构:
mhr2004
原始信息汇总
数据集概述
数据特征
- dataid: 数据类型为
int32 - articleid: 数据类型为
int32 - sent: 数据类型为
string - reverse: 数据类型为
string - prev: 数据类型为
string - prev2: 数据类型为
string - next: 数据类型为
string - next2: 数据类型为
string
数据分割
- affir: 包含 3,185,146 个样本,总字节数为 2,431,421,700
- neg: 包含 3,185,146 个样本,总字节数为 2,876,785,622
数据集大小
- 下载大小: 3,738,923,162 字节
- 数据集大小: 5,308,207,322 字节
配置信息
- 配置名称: default
- 数据文件:
- affir: 路径为
data/affir-* - neg: 路径为
data/neg-*
- affir: 路径为
- 数据文件:



