OdiaGenAI/all_combined_odia_171k
收藏Hugging Face2023-05-23 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/OdiaGenAI/all_combined_odia_171k
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个混合了从开源指令集翻译而来的奥里亚语指令集。数据集包含奥里亚语的指令、输入和输出字符串。数据集的结构为JSON格式,包含四个字段:output、data_source、instruction和input。数据集支持的任务是大语言模型(LLM),语言为奥里亚语。数据集的使用受Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License许可。
该数据集是一个混合了从开源指令集翻译而来的奥里亚语指令集。数据集包含奥里亚语的指令、输入和输出字符串。数据集的结构为JSON格式,包含四个字段:output、data_source、instruction和input。数据集支持的任务是大语言模型(LLM),语言为奥里亚语。数据集的使用受Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License许可。
提供机构:
OdiaGenAI
原始信息汇总
数据集概述
数据集名称
- pretty_name: all_combined_odia_171K
数据集描述
- 摘要: 该数据集包含多种Odia语言的指令集,这些指令集是从开源指令集中翻译而来。
- 包含的指令集:
- dolly-odia-15k
- OdiEnCorp_translation_instructions_25k
- gpt-teacher-roleplay-odia-3k
- Odia_Alpaca_instructions_52k
- hardcode_odia_qa_105
- 数据内容: 提供Odia语言的指令、输入和输出字符串。
支持的任务
- 任务: 大型语言模型(LLM)
语言
- 语言: Odia
数据集结构
- 格式: JSON
数据字段
- output: 字符串
- data_source: 字符串
- instruction: 字符串
- input: 字符串
许可证信息
- 许可证: Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License
贡献者
- Shantipriya Parida
- Sambit Sekhar



