five

Solshine/Hindi_English_QandA_Synth_Data_For_Hinglish_Project

收藏
Hugging Face2024-01-14 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Solshine/Hindi_English_QandA_Synth_Data_For_Hinglish_Project
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是Hugging Face Hinglish培训项目的一部分,包含人工整理的印地语和英语翻译的对话及提示-答案对,主题涉及伦理、系统思维和创造性问题解决,并基于高级心智原则。数据集包括人工智能与伦理、环境与可持续发展、教育与创造力、复杂系统分析等多个领域的问题和答案。每个对话包含印地语问题或提示、英语翻译、印地语建议回答和英语翻译。数据集可用于训练对话系统和AI助手、开发伦理和系统思维教育材料、建模创造性问题解决策略以及改进印地语-英语机器翻译。

该数据集是Hugging Face Hinglish培训项目的一部分,包含人工整理的印地语和英语翻译的对话及提示-答案对,主题涉及伦理、系统思维和创造性问题解决,并基于高级心智原则。数据集包括人工智能与伦理、环境与可持续发展、教育与创造力、复杂系统分析等多个领域的问题和答案。每个对话包含印地语问题或提示、英语翻译、印地语建议回答和英语翻译。数据集可用于训练对话系统和AI助手、开发伦理和系统思维教育材料、建模创造性问题解决策略以及改进印地语-英语机器翻译。
提供机构:
Solshine
原始信息汇总

数据集描述

数据集名称: Hindi-English Synthetic Dataset - Question-Answer Style Dialogues on Ethics, Systems Thinking, and Creative Problem-Solving with High-Level Principles of Mind

数据集来源: 由Hugging Face Hinglish Training Project协调,在Hugging Face Discord上创建。

数据集内容:

  • 包含人工精选的对话和提示-回答对,以印度语(Hindi)和英语翻译呈现,聚焦于伦理、系统思维和创造性问题解决,围绕高级心理原则框架。
  • 数据集包括基于多样领域和话题的问答式对话,涵盖以下主题:
    • 人工智能与伦理: 关于自动驾驶车辆、医疗系统和语言模型中的伦理决策的问题和答案。
    • 环境与可持续发展: 关于可持续农业实践、水管理和应对气候变化的问题和答案。
    • 教育与创造力: 关于发展学生创造性问题解决技能的有效教学方法的问题和答案。
    • 复杂系统分析: 关于理解复杂生态系统、微服务架构和社会经济系统的问题和答案。

数据集结构:

  • 印度语问题或提示: 与话题相关的高级问题,涉及高级心理原则、伦理考虑和STEM原则。
  • 英语翻译的问题或提示: 印度语问题的字面翻译。
  • 印度语建议回答: 结合高级心理原则进行深入分析、协作和问题解决的详细回答。
  • 英语翻译的回答: 建议回答的字面翻译。

潜在应用:

  • 训练对话系统和AI助手: 训练助手模型以实现关于伦理和复杂话题的深入对话。
  • 开发伦理和系统思维的教育材料: 设计课程和培训模块以促进各领域的伦理和系统思维。
  • 建模创造性问题解决策略: 开发创造性思维和探索创新解决方案的模型。
  • 改进印度语-英语机器翻译: 使用复杂话题和高级语言用法训练语言模型。

使用数据集的重要注意事项:

  • 存在一些空白字段,尤其是第四列(英语翻译的回答),偶尔有部分翻译而非全文翻译。空白字段在完整行中较为常见,估计在4%到0.5%的观测中出现。
  • 某些印度语回答中包含一些英语理论(ToM)描述性英语元素,这些错误在数据集中占很小部分。
  • 数据集不支持任何特定产品或服务。
  • 使用任何数据集时,应考虑伦理原则和责任。
  • 提供的回答不表示专家意见,而是旨在激发潜在方向和讨论。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作