ai4bharat/indic-instruct-data-v0.1
收藏Hugging Face2024-03-01 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ai4bharat/indic-instruct-data-v0.1
下载链接
链接失效反馈官方服务:
资源简介:
Indic Instruct Data v0.1数据集是一个包含多种指令数据集的集合,涵盖了英语和印地语两种语言。数据集包括Anudesh、wikiHow、Flan v2、Dolly、Anthropic-HHH、OpenAssistant v1和LymSys-Chat等子集。其中,部分数据集的英语子集通过IndicTrans2进行了翻译,并提供了chrF++分数以评估翻译质量。此外,还创建并发布了两个原生的印地语指令数据集:wikiHow和Anudesh。wikiHow是一个在线wiki风格平台,提供各种主题的how-to文章;Anudesh是一个众包的提示集合,包含由Llama 2 70B模型生成的响应。
提供机构:
ai4bharat
原始信息汇总
数据集概述:
该数据集是一个包含英语和印地语两种语言的指令数据集集合。



