multi-train/trex-train-multikilt_1107
收藏Hugging Face2023-11-10 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/multi-train/trex-train-multikilt_1107
下载链接
链接失效反馈官方服务:
资源简介:
---
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
dataset_info:
features:
- name: query
dtype: string
- name: pos
sequence: string
- name: neg
sequence: string
- name: task
dtype: string
- name: instruction
struct:
- name: query
dtype: string
- name: pos
dtype: string
- name: neg
dtype: string
splits:
- name: train
num_bytes: 228887845
num_examples: 200000
download_size: 116247120
dataset_size: 228887845
---
# Dataset Card for "trex-train-multikilt_1107"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
---
配置项:
- 配置名称:default(默认配置)
数据文件:
- 数据划分:train,路径:data/train-*
数据集信息:
特征:
- 名称:query,数据类型:字符串
- 名称:pos,数据类型:字符串序列
- 名称:neg,数据类型:字符串序列
- 名称:task,数据类型:字符串
- 名称:instruction,结构体:
- 名称:query,数据类型:字符串
- 名称:pos,数据类型:字符串
- 名称:neg,数据类型:字符串
数据划分:
- 名称:train,字节数:228887845,样本数:200000
下载大小:116247120,数据集总大小:228887845
---
# "trex-train-multikilt_1107" 数据集卡片
[需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
multi-train
原始信息汇总
数据集概述
配置
- 默认配置名称:
default - 数据文件路径:
data/train-*
数据集信息
特征
query: 数据类型为stringpos: 数据类型为string的序列neg: 数据类型为string的序列task: 数据类型为stringinstruction: 结构体,包含以下字段:query: 数据类型为stringpos: 数据类型为stringneg: 数据类型为string
分割
train: 包含 200000 个样本,总字节数为 228887845
大小
- 下载大小: 116247120 字节
- 数据集大小: 228887845 字节



