five

adi-kmt/gooftagoo

收藏
Hugging Face2024-03-16 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/adi-kmt/gooftagoo
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含印地语和Hinglish(印地语和英语的混合)的对话文本,涵盖了多轮对话,主题通常围绕日常现实生活经验。此外,数据集还包含少量推理任务,特别是COT风格的推理和编码,约有1k个样本来自Openhermes 2.5。需要注意的是,该数据集是生成的,内容可能不完全准确或反映专家共识,建议用户独立验证信息。

该数据集包含印地语和Hinglish(印地语和英语的混合)的对话文本,涵盖了多轮对话,主题通常围绕日常现实生活经验。此外,数据集还包含少量推理任务,特别是COT风格的推理和编码,约有1k个样本来自Openhermes 2.5。需要注意的是,该数据集是生成的,内容可能不完全准确或反映专家共识,建议用户独立验证信息。
提供机构:
adi-kmt
原始信息汇总

数据集概述

数据集名称

Hindi/Hinglish Conversation Dataset

数据集内容

  • 语言: 包含印地语(Hindi)和混合语(Hinglish,即印地语和英语的混合)。
  • 类型: 对话文本数据集,涵盖多轮对话。
  • 主题: 主要围绕日常生活中的真实体验。
  • 附加内容: 包含少量推理任务,约1000个样本,涉及COT风格推理和编码,数据来源于Openhermes 2.5。

使用注意事项

  • 该数据集为生成数据,部分内容可能不完全准确或反映专家共识。
  • 建议用户在学术或批判性使用时独立验证信息。

许可协议

Apache-2.0

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作