adi-kmt/gooftagoo
收藏Hugging Face2024-03-16 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/adi-kmt/gooftagoo
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含印地语和Hinglish(印地语和英语的混合)的对话文本,涵盖了多轮对话,主题通常围绕日常现实生活经验。此外,数据集还包含少量推理任务,特别是COT风格的推理和编码,约有1k个样本来自Openhermes 2.5。需要注意的是,该数据集是生成的,内容可能不完全准确或反映专家共识,建议用户独立验证信息。
该数据集包含印地语和Hinglish(印地语和英语的混合)的对话文本,涵盖了多轮对话,主题通常围绕日常现实生活经验。此外,数据集还包含少量推理任务,特别是COT风格的推理和编码,约有1k个样本来自Openhermes 2.5。需要注意的是,该数据集是生成的,内容可能不完全准确或反映专家共识,建议用户独立验证信息。
提供机构:
adi-kmt
原始信息汇总
数据集概述
数据集名称
Hindi/Hinglish Conversation Dataset
数据集内容
- 语言: 包含印地语(Hindi)和混合语(Hinglish,即印地语和英语的混合)。
- 类型: 对话文本数据集,涵盖多轮对话。
- 主题: 主要围绕日常生活中的真实体验。
- 附加内容: 包含少量推理任务,约1000个样本,涉及COT风格推理和编码,数据来源于Openhermes 2.5。
使用注意事项
- 该数据集为生成数据,部分内容可能不完全准确或反映专家共识。
- 建议用户在学术或批判性使用时独立验证信息。
许可协议
Apache-2.0



