ahmadSiddiqi/t5
收藏Hugging Face2024-01-27 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ahmadSiddiqi/t5
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: id
dtype: string
- name: text
dtype: string
splits:
- name: corpus
num_bytes: 20943727
num_examples: 22633
- name: queries
num_bytes: 23573
num_examples: 222
download_size: 8722569
dataset_size: 20967300
configs:
- config_name: default
data_files:
- split: corpus
path: data/corpus-*
- split: queries
path: data/queries-*
---
数据集信息:
特征:
- 字段名:id,数据类型:字符串
- 字段名:text,数据类型:字符串
数据拆分:
- 拆分名称:语料库(corpus),字节数:20943727,样本数:22633
- 拆分名称:查询集(queries),字节数:23573,样本数:222
下载大小:8722569,数据集总大小:20967300
配置项:
- 配置名称:默认配置(default),数据文件:
- 数据拆分:corpus,路径:data/corpus-*
- 数据拆分:queries,路径:data/queries-*
提供机构:
ahmadSiddiqi
原始信息汇总
数据集概述
特征信息
- id: 数据类型为字符串。
- text: 数据类型为字符串。
数据分割
- corpus:
- 字节数: 20943727
- 样本数: 22633
- queries:
- 字节数: 23573
- 样本数: 222
数据大小
- 下载大小: 8722569 字节
- 数据集大小: 20967300 字节
配置信息
- default 配置:
- 数据文件:
- corpus 分割:
data/corpus-* - queries 分割:
data/queries-*
- corpus 分割:
- 数据文件:



