amitagh/marathi-orca-v05
收藏Hugging Face2024-05-21 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/amitagh/marathi-orca-v05
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是Open-Orca/1million-gpt-4的马拉地语翻译子集,包含100,000个示例,主要用于文本生成和问答任务。数据集特征包括行号、ID、英文系统提示、马拉地语系统提示、英文问题、马拉地语问题、英文回答和马拉地语回答。数据集大小为418,882,307字节,下载大小为159,689,428字节。
该数据集是Open-Orca/1million-gpt-4的马拉地语翻译子集,包含100,000个示例,主要用于文本生成和问答任务。数据集特征包括行号、ID、英文系统提示、马拉地语系统提示、英文问题、马拉地语问题、英文回答和马拉地语回答。数据集大小为418,882,307字节,下载大小为159,689,428字节。
提供机构:
amitagh
原始信息汇总
数据集概述
数据集特征
- row_num: 整数类型 (int64)
- id: 字符串类型 (string)
- eng_system_prompt: 字符串类型 (string)
- mar_system_prompt: 字符串类型 (string)
- eng_question: 字符串类型 (string)
- mar_question: 字符串类型 (string)
- eng_response: 字符串类型 (string)
- mar_response: 字符串类型 (string)
数据集划分
- train:
- 示例数量: 100000
- 数据大小: 418882307 字节
数据集大小
- 下载大小: 159689428 字节
- 数据集总大小: 418882307 字节
许可
- MIT 许可
任务类别
- 文本生成
- 问答
语言
- 马拉地语 (mr)
- 英语 (en)



