AtlasUnified/Atlas-Reasoning
收藏Hugging Face2023-06-11 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/AtlasUnified/Atlas-Reasoning
下载链接
链接失效反馈官方服务:
资源简介:
ATLAS-REASONING数据集是由GPT-3.5-turbo生成的合成数据,涵盖了广泛的推理和逻辑相关主题。数据集包含多个类别,如演绎推理、归纳推理、非形式逻辑、认知偏差、逻辑谬误、概率论、普遍性、语言逻辑、道德推理、哲学推理、类比推理、集合论、溯因推理、决策理论和认识论等。每个类别下又细分为多个子类别,详细探讨了各种推理和逻辑问题。
ATLAS-REASONING数据集是由GPT-3.5-turbo生成的合成数据,涵盖了广泛的推理和逻辑相关主题。数据集包含多个类别,如演绎推理、归纳推理、非形式逻辑、认知偏差、逻辑谬误、概率论、普遍性、语言逻辑、道德推理、哲学推理、类比推理、集合论、溯因推理、决策理论和认识论等。每个类别下又细分为多个子类别,详细探讨了各种推理和逻辑问题。
提供机构:
AtlasUnified
原始信息汇总
数据集概述
基本信息
- 许可证: MIT
- 语言: 英语
- 数据集名称: 15k Reasoning
- 大小: 10K<n<100K
数据集来源与生成
- 来源: 该数据集源自atlasunified/atlas-reasoning代码库。
- 生成方式: 通过GPT-3.5-turbo合成生成。
数据集内容
主要类别
数据集包含42个主要类别,其中主类别由人工定义,子类别则由GPT-4生成。以下是部分主要类别的概述:
1. 演绎推理
- 包含如Syllogistic Arguments, Assumptions, Abductive Reasoning等子类别。
2. 归纳推理
- 包含如Hypothetical Reasoning, Analogy, Probabilistic Reasoning等子类别。
3. 非形式逻辑
- 包含如Fallacies in reasoning, Argument analysis and evaluation, Causal reasoning等子类别。
4. 认知偏差
- 包含如Confirmation bias, Availability heuristic, Anchoring bias等子类别。
5. 逻辑谬误
- 包含如Ad Hominem Fallacy, Straw Man Fallacy, Appeal to Authority Fallacy等子类别。
6. 概率理论
- 包含如Conditional probability, Bayes theorem, Combinatorics and counting principles等子类别。
7. 普遍性
- 包含如Turing machines, Computational universality, Halting problem等子类别。
8. 语言逻辑
- 包含如Propositional logic, Predicate logic, Formal languages等子类别。
9. 道德推理
- 包含如Moral dilemmas in healthcare, Ethical considerations in scientific research等子类别。
10. 哲学推理
- 包含如The nature of knowledge, Epistemological skepticism, Theories of truth等子类别。
11. 类比推理
- 包含如Identifying similarities and differences between two objects, Applying analogical reasoning in problem-solving等子类别。
12. 集合论
- 包含如Union of sets, Intersection of sets, Complement of a set等子类别。
13. 溯因推理
- 包含如Hypothesis generation in abductive reasoning, Evidence evaluation in abductive reasoning等子类别。
14. 决策理论
- 包含如Utility theory, Rational choice theory, Expected utility theory等子类别。
15. 认识论
- 包含如Foundationalism vs. Coherentism, Empiricism vs. Rationalism等子类别。
16. 思维导图
- 包含如Techniques for creating effective mind maps, Applying mind mapping to problem-solving等子类别。
总结
该数据集“15k Reasoning”是一个合成生成的数据集,专注于多种推理和逻辑类别,适用于教育和研究目的。数据集内容丰富,涵盖了从基础逻辑到高级哲学推理的广泛主题。
搜集汇总
数据集介绍

构建方式
该数据集Atlas-Reasoning源自atlasunified/atlas-reasoning,由GPT-3.5-turbo合成生成。主要类别由人工衍生,子类别则由GPT-4合成生成。数据集包含15k个推理相关的样本,涵盖推理的不同类别,如演绎推理、归纳推理、非形式逻辑、认知偏差、逻辑谬误、概率论、普遍性、语言逻辑、道德推理、哲学推理、类比推理、集合论、溯因推理、决策理论、认识论和思维导图等。
特点
Atlas-Reasoning数据集的特点在于其涵盖了推理的多个方面,如演绎推理、归纳推理、非形式逻辑、认知偏差、逻辑谬误、概率论、普遍性、语言逻辑、道德推理、哲学推理、类比推理、集合论、溯因推理、决策理论、认识论和思维导图等。数据集的样本由GPT-3.5-turbo合成生成,具有一定的创新性和实用性。
使用方法
使用Atlas-Reasoning数据集时,用户需要首先了解数据集的类别和结构,然后根据需要选择相应的类别进行推理实验。例如,用户可以进行演绎推理、归纳推理、非形式逻辑、认知偏差、逻辑谬误、概率论、普遍性、语言逻辑、道德推理、哲学推理、类比推理、集合论、溯因推理、决策理论、认识论和思维导图等实验。用户可以使用Python等编程语言对数据集进行处理和分析。
背景与挑战
背景概述
在人工智能领域,推理能力的研究对于构建智能系统至关重要。Atlas-Reasoning 数据集,源自 atlasunified/atlas-reasoning 项目,由 GPT-3.5-turbo 生成,旨在提供一个涵盖广泛推理类型的数据集。该数据集涵盖了从演绎推理到归纳推理,从形式逻辑到非形式逻辑等多个方面,共计 42 个主要类别,并细分为众多子类别。该数据集的创建旨在为研究人员提供一个用于训练和测试推理模型的标准数据集,以促进推理能力的发展。
当前挑战
尽管 Atlas-Reasoning 数据集提供了丰富的推理类型,但在实际应用中,仍面临诸多挑战。首先,推理任务的多样性和复杂性使得模型的泛化能力成为一个关键问题。其次,数据集的生成方式可能限制了其真实性和多样性,导致模型在实际应用中的表现与预期存在差距。此外,推理过程中的认知偏差和逻辑谬误等挑战也需要进一步研究,以提升模型在复杂推理任务中的表现。
常用场景
经典使用场景
在人工智能和自然语言处理领域,'Atlas-Reasoning'数据集被广泛应用于推理能力的研究与开发。通过提供大量关于演绎推理、归纳推理、非正式逻辑、认知偏差、逻辑谬误、概率理论、普适性、语言逻辑、道德推理、哲学推理、类比推理、集合论、溯因推理、决策理论和认识论的示例,该数据集为研究者提供了丰富的训练数据,以构建和评估推理模型。这些模型在解决诸如问题解决、决策制定、假设生成和证据评估等任务时表现出色。
实际应用
'Atlas-Reasoning'数据集的实际应用场景广泛,包括智能问答系统、决策支持系统、自然语言生成和机器翻译等。通过使用该数据集训练的模型,这些系统能够更好地理解和处理人类语言中的推理任务,从而提供更准确和有用的信息。此外,该数据集还可以用于教育领域,帮助学生提高推理能力和批判性思维能力。
衍生相关工作
'Atlas-Reasoning'数据集的发布激发了众多相关研究,包括对推理模型的性能评估、对不同类型推理的比较研究以及对认知偏差和逻辑谬误的深入分析。此外,该数据集还促进了跨学科研究,如将推理模型应用于心理学、哲学和经济学等领域。
以上内容由遇见数据集搜集并总结生成



