five

0xAIT/sinhala-flan

收藏
Hugging Face2024-08-22 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/0xAIT/sinhala-flan
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含四个主要特征:Original Input(原始输入)、Translated Input(翻译后的输入)、Original Target(原始目标)和Translated Target(翻译后的目标),所有特征的数据类型均为字符串。数据集分为两个子集:subset_cot_zsopt和subset_cot_fsopt,其中subset_cot_zsopt子集包含95570个样本,占用134572215字节。数据集的配置文件名为default,指定了各个子集的数据文件路径。

The dataset contains four main features: Original Input, Translated Input, Original Target, and Translated Target, all of which are of string data type. The dataset is divided into two subsets: subset_cot_zsopt and subset_cot_fsopt, with the subset_cot_zsopt subset containing 95,570 samples and occupying 134,572,215 bytes. The datasets configuration file is named default, which specifies the data file paths for each subset.
提供机构:
0xAIT
原始信息汇总

数据集概述

数据特征

  • Original Input: 原始输入文本,数据类型为字符串。
  • Translated Input: 翻译后的输入文本,数据类型为字符串。
  • Original Target: 原始目标文本,数据类型为字符串。
  • Translated Target: 翻译后的目标文本,数据类型为字符串。

数据分割

  • subset_cot_zsopt:
    • 数据量: 134,572,215 字节
    • 样本数量: 95,570
  • subset_cot_fsopt:
    • 数据量: 未提供
    • 样本数量: 未提供

配置

  • default:
    • 数据文件路径:
      • subset_cot_zsopt: data/subset_cot_zsopt-*
      • subset_cot_fsopt: data/subset_cot_fsopt-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作