ravithejads/alpaca_marathi_cleaned_output
收藏Hugging Face2024-03-14 更新2024-05-25 收录
下载链接:
https://hf-mirror.com/datasets/ravithejads/alpaca_marathi_cleaned_output
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个特征字段,主要涉及指令、输入和输出,并且这些字段在泰卢固语(Telugu)和马拉地语(Marathi)中都有相应的翻译和音译版本。数据集包含一个训练集,大小为220307094字节,包含28910个示例。下载大小为93883153字节。
提供机构:
ravithejads
原始信息汇总
数据集概述
数据集特征
- instruction (字符串)
- input (字符串)
- output (字符串)
- telugu_instruction (字符串)
- telugu_input (字符串)
- telugu_output (字符串)
- telugu_transliterated_instruction (字符串)
- telugu_transliterated_input (字符串)
- telugu_transliterated_output (字符串)
- marathi_instruction (字符串)
- marathi_input (字符串)
- marathi_output (字符串)
数据集分割
- train
- 字节数: 220307094
- 示例数: 28910
数据集大小
- 下载大小: 93883153
- 数据集大小: 220307094
配置
- config_name: default
- data_files
- split: train
- path: data/train-*



