five

ai4bharat/indic-instruct-data-v0.1

收藏
Hugging Face2024-03-01 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ai4bharat/indic-instruct-data-v0.1
下载链接
链接失效反馈
官方服务:
资源简介:
Indic Instruct Data v0.1数据集是一个包含多种指令数据集的集合,涵盖了英语和印地语两种语言。数据集包括Anudesh、wikiHow、Flan v2、Dolly、Anthropic-HHH、OpenAssistant v1和LymSys-Chat等子集。其中,部分数据集的英语子集通过IndicTrans2进行了翻译,并提供了chrF++分数以评估翻译质量。此外,还创建并发布了两个原生的印地语指令数据集:wikiHow和Anudesh。wikiHow是一个在线wiki风格平台,提供各种主题的how-to文章;Anudesh是一个众包的提示集合,包含由Llama 2 70B模型生成的响应。
提供机构:
ai4bharat
原始信息汇总

数据集概述:

该数据集是一个包含英语和印地语两种语言的指令数据集集合。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作