five

169Pi/indic_reasoning

收藏
Hugging Face2025-09-20 更新2025-10-18 收录
下载链接:
https://hf-mirror.com/datasets/169Pi/indic_reasoning
下载链接
链接失效反馈
官方服务:
资源简介:
Indic Reasoning 数据集(约5亿个token,59.2万个示例)是一个高质量、大规模的开源资源,使用先进的蒸馏技术创建。它旨在训练和评估具有推理能力的AI系统,特别强调复杂的推理、结构化的思维链(CoT)和文化相关内容。这个领域丰富的语料库整合了印度文化、法律、历史、哲学和社会背景,使其成为最全面的跨领域推理数据集之一。它特别适合用于微调指令遵循模型,以实现对印度知识体系和跨文化推理的深入理解,用于研究、教育和AI开发。

The Indic Reasoning Dataset (~500M tokens, 592k examples) is a high-quality, large-scale open-source resource created using advanced distillation techniques. It is designed to train and evaluate reasoning-capable AI systems with a strong emphasis on complex reasoning, structured chain-of-thought (CoT), and culturally relevant content.
提供机构:
169Pi
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作