five

AkhileshNandan/Indic-Rag-Suite_formatted

收藏
Hugging Face2025-08-31 更新2025-10-25 收录
下载链接:
https://hf-mirror.com/datasets/AkhileshNandan/Indic-Rag-Suite_formatted
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个多语言的印度语言数据集,包含问题、答案和推理信息,适用于问答和文本生成任务。数据集基于维基百科和Llama 3.3 70B模型,提供了马来语部分的数据,并经过下采样和格式化处理,每个样本包含问题、答案、推理、来源维基百科段落、文章标题、文章ID、URL、语言代码和组合文本信息。

This is a multilingual Indian language dataset containing questions, answers, and reasoning information, suitable for question-answering and text generation tasks. The dataset is based on Wikipedia and Llama 3.3 70B model, providing the Malayalam part of the data, and has been downsampled and formatted. Each sample includes question, answer, reasoning, source Wikipedia paragraph, article title, article ID, URL, language code, and combined text information.
提供机构:
AkhileshNandan
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作