CriticalThinking-Finetuning-Dataset|教育数据集|技能开发数据集
收藏CriticalThinking-Finetuning-Dataset
简介
本数据集旨在通过微调大语言模型来提升用户的批判性思维和推理能力。数据集包括结构化的问答环节、角色扮演场景和辩论,旨在引导用户进行分析、评估和构建有逻辑的论证。该数据集鼓励深度思考和反思性学习,特别适用于教育、辅导以及技能开发等领域的应用。
数据集内容
该数据集由各种对话示例组成,旨在激发批判性思维。它包括以下类型的交互:
- 问答环节:结构化的问答格式,引导用户进行逻辑思考,并鼓励对主题进行更深入的探索。
- 角色扮演场景:用户在假设情境中被分配不同角色,鼓励他们从多个角度评估问题。
- 辩论:数据集中包含辩论结构,用户可以为或反对给定的命题进行辩论,从而提升他们的推理技能。
示例结构
问答环节
json { "role": "user", "content": "抽象艺术如何挑战了传统的艺术观念?" }, { "role": "assistant", "content": "很好的问题!首先你能告诉我创新活动在日常生活中的一些例子吗?" }, { "role": "user", "content": "比如吸尘器的发明,使得大家不再需要手动扫地。" }, { "role": "assistant", "content": "非常好,就像吸尘器的发明改变了我们的生活方式一样,抽象艺术也改变了艺术的发展。抽象艺术与传统艺术有何不同,你觉得呢?" }
角色扮演场景
json [ "请和我开始批判性思维情景对话训练", "今天我们来进行一个批判性思维训练。想象一下,你身处一个城市规划委员会的会议中,讨论关于城市公共交通改革的提案。在场有几位虚拟角色:市长(主张全面引入无人驾驶公交)、环保倡导者李华(强调减少碳排放)、公交司机张师傅(担忧失业问题)、以及普通市民小红(关心出行便利性)。请选择一位角色扮演。" ], [ "我想扮演环保倡导者李华。", "很好,李华。现在,有一个观点是“无人驾驶公交能显著提高效率并减少交通拥堵”,你怎么看?" ], [ "作为李华,我完全同意这个观点。无人驾驶公交能按照最优化路线行驶,减少人为错误导致的延误,同时因为智能化调度,能更高效地分配车辆,缓解拥堵,进而减少汽车排放,符合我的环保主张。", "很好的分析,李华。接下来,我们深入一点。我注意到你在谈论中提到了“最优化路线”和“减少排放”。请具体解释一下这两个限定词对你立场的重要性。" ]
辩论示例
json [ "请和我开始一轮辩论。", "今天我们来进行一场辩论。辩题是:“网络课程应该成为主流教育形式。”正方认为网络课程提供了灵活性和可访问性,是未来教育的趋势。反方则认为网络课程无法提供足够的互动和实践机会,不应成为主流教育形式。你想 支持哪一方?" ], [ "我支持正方。", "很好,请开始你的第一轮发言。" ], [ "网络课程提供了很大的灵活性。学生可以根据自己的时间表自由安排学习,而且可以接触到世界各地最好的教育资源。", "灵活性确实是网络课程的优点之一。然而,网络学习的过度灵活性可能会导致学生缺乏自律,这不是一个问题吗?学生可能因为缺乏固定的学习结构而学习不足。" ]
文件结构
bash Critical-Thinking-Training-Dataset/ │ ├── data/ │ ├── Q&A.json # 包含结构化的问答环节 │ ├── situation.json # 包含角色扮演场景数据 │ ├── debate.json # 包含辩论数据,用于批判性思维练习 │ ├── README.md # 概述和使用说明 ├── LICENSE # 许可证信息 └── requirements.txt # 使用数据集所需的依赖项
许可证
此数据集在 MIT 许可证下发布。您可以出于任何目的自由使用、修改和分发它,只要您提供原作者的署名即可。

OMIM (Online Mendelian Inheritance in Man)
OMIM是一个包含人类基因和遗传疾病信息的在线数据库。它提供了详细的遗传疾病描述、基因定位、相关文献和临床信息。数据集内容包括疾病名称、基因名称、基因定位、遗传模式、临床特征、相关文献引用等。
www.omim.org 收录
Asteroids by the Minor Planet Center
包含所有已知小行星的轨道数据和观测数据。数据来源于Minor Planet Center,格式包括Fortran (.DAT)和JSON,数据集大小为81MB(压缩)和450MB(未压缩),记录数约750,000条,每日更新。
github 收录
ICESat-2 Data
ICESat-2 Data 是由美国国家航空航天局(NASA)发布的卫星数据集,主要用于全球冰层和陆地高程的测量。该数据集包括高精度激光测高数据,用于研究冰川、海冰、植被和地形变化。
icesat-2.gsfc.nasa.gov 收录
DAT
DAT是一个统一的跨场景跨领域基准,用于开放世界无人机主动跟踪。它提供了24个视觉复杂的场景,以评估算法的跨场景和跨领域泛化能力,并具有高保真度的现实机器人动力学建模。
github 收录
全国 1∶200 000 数字地质图(公开版)空间数据库
As the only one of its kind, China National Digital Geological Map (Public Version at 1∶200 000 scale) Spatial Database (CNDGM-PVSD) is based on China' s former nationwide measured results of regional geological survey at 1∶200 000 scale, and is also one of the nationwide basic geosciences spatial databases jointly accomplished by multiple organizations of China. Spatially, it embraces 1 163 geological map-sheets (at scale 1: 200 000) in both formats of MapGIS and ArcGIS, covering 72% of China's whole territory with a total data volume of 90 GB. Its main sources is from 1∶200 000 regional geological survey reports, geological maps, and mineral resources maps with an original time span from mid-1950s to early 1990s. Approved by the State's related agencies, it meets all the related technical qualification requirements and standards issued by China Geological Survey in data integrity, logic consistency, location acc racy, attribution fineness, and collation precision, and is hence of excellent and reliable quality. The CNDGM-PVSD is an important component of China' s national spatial database categories, serving as a spatial digital platform for the information construction of the State's national economy, and providing informationbackbones to the national and provincial economic planning, geohazard monitoring, geological survey, mineral resources exploration as well as macro decision-making.
DataCite Commons 收录