five

maya-research/IndicVault

收藏
Hugging Face2025-05-06 更新2025-05-31 收录
下载链接:
https://hf-mirror.com/datasets/maya-research/IndicVault
下载链接
链接失效反馈
官方服务:
资源简介:
Indic Vault是一个面向聊天机器人和语音助手的高质量、指令微调的数据集,包含2025年印度日常使用的当代语言中的问题回答对。它涵盖了20个必要主题,包括金融、健康、技术、人际关系等,以自然、口语化的语言风格为特点,提供有意义且上下文相关的信息。该数据集支持从4B到27B参数的开源模型进行微调。

Indic Vault is a high-quality, instruction-tuned dataset featuring question-answer pairs in the contemporary, everyday language spoken across India in 2025. It covers 20 essential topics such as Finance, Health, Technology, Relationships, and more, characterized by natural, colloquial language and meaningful, contextually relevant information. The dataset supports fine-tuning on open-source models ranging from 4B to 27B parameters.
提供机构:
maya-research
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作