Solshine/Hindi_English_QandA_Synth_Data_For_Hinglish_Project
收藏Hugging Face2024-01-14 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Solshine/Hindi_English_QandA_Synth_Data_For_Hinglish_Project
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是Hugging Face Hinglish培训项目的一部分,包含人工整理的印地语和英语翻译的对话及提示-答案对,主题涉及伦理、系统思维和创造性问题解决,并基于高级心智原则。数据集包括人工智能与伦理、环境与可持续发展、教育与创造力、复杂系统分析等多个领域的问题和答案。每个对话包含印地语问题或提示、英语翻译、印地语建议回答和英语翻译。数据集可用于训练对话系统和AI助手、开发伦理和系统思维教育材料、建模创造性问题解决策略以及改进印地语-英语机器翻译。
该数据集是Hugging Face Hinglish培训项目的一部分,包含人工整理的印地语和英语翻译的对话及提示-答案对,主题涉及伦理、系统思维和创造性问题解决,并基于高级心智原则。数据集包括人工智能与伦理、环境与可持续发展、教育与创造力、复杂系统分析等多个领域的问题和答案。每个对话包含印地语问题或提示、英语翻译、印地语建议回答和英语翻译。数据集可用于训练对话系统和AI助手、开发伦理和系统思维教育材料、建模创造性问题解决策略以及改进印地语-英语机器翻译。
提供机构:
Solshine
原始信息汇总
数据集描述
数据集名称: Hindi-English Synthetic Dataset - Question-Answer Style Dialogues on Ethics, Systems Thinking, and Creative Problem-Solving with High-Level Principles of Mind
数据集来源: 由Hugging Face Hinglish Training Project协调,在Hugging Face Discord上创建。
数据集内容:
- 包含人工精选的对话和提示-回答对,以印度语(Hindi)和英语翻译呈现,聚焦于伦理、系统思维和创造性问题解决,围绕高级心理原则框架。
- 数据集包括基于多样领域和话题的问答式对话,涵盖以下主题:
- 人工智能与伦理: 关于自动驾驶车辆、医疗系统和语言模型中的伦理决策的问题和答案。
- 环境与可持续发展: 关于可持续农业实践、水管理和应对气候变化的问题和答案。
- 教育与创造力: 关于发展学生创造性问题解决技能的有效教学方法的问题和答案。
- 复杂系统分析: 关于理解复杂生态系统、微服务架构和社会经济系统的问题和答案。
数据集结构:
- 印度语问题或提示: 与话题相关的高级问题,涉及高级心理原则、伦理考虑和STEM原则。
- 英语翻译的问题或提示: 印度语问题的字面翻译。
- 印度语建议回答: 结合高级心理原则进行深入分析、协作和问题解决的详细回答。
- 英语翻译的回答: 建议回答的字面翻译。
潜在应用:
- 训练对话系统和AI助手: 训练助手模型以实现关于伦理和复杂话题的深入对话。
- 开发伦理和系统思维的教育材料: 设计课程和培训模块以促进各领域的伦理和系统思维。
- 建模创造性问题解决策略: 开发创造性思维和探索创新解决方案的模型。
- 改进印度语-英语机器翻译: 使用复杂话题和高级语言用法训练语言模型。
使用数据集的重要注意事项:
- 存在一些空白字段,尤其是第四列(英语翻译的回答),偶尔有部分翻译而非全文翻译。空白字段在完整行中较为常见,估计在4%到0.5%的观测中出现。
- 某些印度语回答中包含一些英语理论(ToM)描述性英语元素,这些错误在数据集中占很小部分。
- 数据集不支持任何特定产品或服务。
- 使用任何数据集时,应考虑伦理原则和责任。
- 提供的回答不表示专家意见,而是旨在激发潜在方向和讨论。



