CognitiveLab/Hindi-Instruct
收藏Hugging Face2024-02-21 更新2025-04-19 收录
下载链接:
https://hf-mirror.com/datasets/CognitiveLab/Hindi-Instruct
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: messages
list:
- name: content
dtype: string
- name: role
dtype: string
- name: prompt
dtype: string
- name: text
dtype: string
- name: input_ids
sequence: int32
- name: attention_mask
sequence: int8
splits:
- name: train
num_bytes: 1643181241.9655485
num_examples: 91328
- name: test
num_bytes: 182583690.03445148
num_examples: 10148
download_size: 761577295
dataset_size: 1825764932.0
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: test
path: data/test-*
---
数据集信息:
特征集合:
- 名称:messages,为列表类型,包含以下子字段:
- 子字段名称:content(内容),数据类型:字符串(string)
- 子字段名称:role(角色),数据类型:字符串(string)
- 名称:提示词(prompt),数据类型:字符串(string)
- 名称:text,数据类型:字符串(string)
- 名称:输入标识序列(input_ids),数据类型:int32序列
- 名称:注意力掩码(attention_mask),数据类型:int8序列
数据集划分:
- 划分名称:训练集(train),字节大小:1643181241.9655485,样本数量:91328
- 划分名称:测试集(test),字节大小:182583690.03445148,样本数量:10148
下载总大小:761577295
总数据集存储大小:1825764932.0
配置项:
- 配置名称:default(默认配置),数据文件路径:
- 训练划分对应路径:data/train-*
- 测试划分对应路径:data/test-*
提供机构:
CognitiveLab



