0xAIT/sinhala-flan
收藏Hugging Face2024-08-22 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/0xAIT/sinhala-flan
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含四个主要特征:Original Input(原始输入)、Translated Input(翻译后的输入)、Original Target(原始目标)和Translated Target(翻译后的目标),所有特征的数据类型均为字符串。数据集分为两个子集:subset_cot_zsopt和subset_cot_fsopt,其中subset_cot_zsopt子集包含95570个样本,占用134572215字节。数据集的配置文件名为default,指定了各个子集的数据文件路径。
The dataset contains four main features: Original Input, Translated Input, Original Target, and Translated Target, all of which are of string data type. The dataset is divided into two subsets: subset_cot_zsopt and subset_cot_fsopt, with the subset_cot_zsopt subset containing 95,570 samples and occupying 134,572,215 bytes. The datasets configuration file is named default, which specifies the data file paths for each subset.
提供机构:
0xAIT
原始信息汇总
数据集概述
数据特征
- Original Input: 原始输入文本,数据类型为字符串。
- Translated Input: 翻译后的输入文本,数据类型为字符串。
- Original Target: 原始目标文本,数据类型为字符串。
- Translated Target: 翻译后的目标文本,数据类型为字符串。
数据分割
- subset_cot_zsopt:
- 数据量: 134,572,215 字节
- 样本数量: 95,570
- subset_cot_fsopt:
- 数据量: 未提供
- 样本数量: 未提供
配置
- default:
- 数据文件路径:
subset_cot_zsopt:data/subset_cot_zsopt-*subset_cot_fsopt:data/subset_cot_fsopt-*
- 数据文件路径:



