carlosejimenez/qqp_corpus_trainval
收藏Hugging Face2022-11-23 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/carlosejimenez/qqp_corpus_trainval
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: idx
dtype: int64
- name: text
dtype: string
splits:
- name: test
num_bytes: 52434356
num_examples: 390965
- name: train
num_bytes: 53724642
num_examples: 404276
- name: validation
num_bytes: 5370744
num_examples: 40430
download_size: 50205619
dataset_size: 111529742
---
# Dataset Card for "qqp_corpus_trainval"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
---
数据集信息:
特征项:
- 名称:idx,数据类型:int64
- 名称:text,数据类型:string
数据集拆分:
- 拆分标识:test(测试集),字节占用:52434356,样本总数:390965
- 拆分标识:train(训练集),字节占用:53724642,样本总数:404276
- 拆分标识:validation(验证集),字节占用:5370744,样本总数:40430
下载总大小:50205619,数据集总占用大小:111529742
---
# "qqp_corpus_trainval"数据集卡片
[更多信息请参阅](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
carlosejimenez
原始信息汇总
数据集概述
数据集名称
qqp_corpus_trainval
数据集特征
- idx: 数据类型为
int64 - text: 数据类型为
string
数据集分割
- test:
- 数据量: 52434356 字节
- 示例数量: 390965
- train:
- 数据量: 53724642 字节
- 示例数量: 404276
- validation:
- 数据量: 5370744 字节
- 示例数量: 40430
数据集大小
- 下载大小: 50205619 字节
- 数据集总大小: 111529742 字节



