five

OdiaGenAI/all_combined_odia_171k

收藏
Hugging Face2023-05-23 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/OdiaGenAI/all_combined_odia_171k
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个混合了从开源指令集翻译而来的奥里亚语指令集。数据集包含奥里亚语的指令、输入和输出字符串。数据集的结构为JSON格式,包含四个字段:output、data_source、instruction和input。数据集支持的任务是大语言模型(LLM),语言为奥里亚语。数据集的使用受Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License许可。

该数据集是一个混合了从开源指令集翻译而来的奥里亚语指令集。数据集包含奥里亚语的指令、输入和输出字符串。数据集的结构为JSON格式,包含四个字段:output、data_source、instruction和input。数据集支持的任务是大语言模型(LLM),语言为奥里亚语。数据集的使用受Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License许可。
提供机构:
OdiaGenAI
原始信息汇总

数据集概述

数据集名称

  • pretty_name: all_combined_odia_171K

数据集描述

  • 摘要: 该数据集包含多种Odia语言的指令集,这些指令集是从开源指令集中翻译而来。
  • 包含的指令集:
    • dolly-odia-15k
    • OdiEnCorp_translation_instructions_25k
    • gpt-teacher-roleplay-odia-3k
    • Odia_Alpaca_instructions_52k
    • hardcode_odia_qa_105
  • 数据内容: 提供Odia语言的指令、输入和输出字符串。

支持的任务

  • 任务: 大型语言模型(LLM)

语言

  • 语言: Odia

数据集结构

  • 格式: JSON

数据字段

  • output: 字符串
  • data_source: 字符串
  • instruction: 字符串
  • input: 字符串

许可证信息

  • 许可证: Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License

贡献者

  • Shantipriya Parida
  • Sambit Sekhar
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作