CriticalThinker

Hugging Face2024-12-26 更新2024-12-27 收录

下载链接：

https://huggingface.co/datasets/theeseus-ai/CriticalThinker

下载链接

链接失效反馈

官方服务：

资源简介：

Critical Thinking Synthetic数据集是一个高质量的、机器生成的场景集合，旨在增强和评估逻辑推理、分析思维和问题解决能力。该数据集特别适用于训练和微调大型语言模型（LLMs），重点关注决策、推理和多层次推理过程。数据集作为认知推理任务的基准，提供复杂的、多层次的场景，需要调查和分析方法。每个示例都遵循结构化格式，便于一致的评估和可重复的实验。

The Critical Thinking Synthetic Dataset is a high-quality, machine-generated collection of scenarios designed to enhance and evaluate logical reasoning, analytical thinking, and problem-solving abilities. This dataset is particularly suitable for training and fine-tuning Large Language Models (LLMs), with a focus on decision-making, reasoning, and multi-level reasoning processes. Serving as a benchmark for cognitive reasoning tasks, the dataset provides complex, multi-level scenarios that require investigative and analytical approaches. Each example follows a structured format, facilitating consistent evaluation and reproducible experiments.

创建时间：

2024-12-24

原始信息汇总

Critical Thinking Synthetic Dataset 数据集概述

数据集简介

名称: Critical Thinking Synthetic Dataset
语言: 英语 (en)
用途: 用于增强和评估逻辑推理、分析思维和问题解决能力，特别适用于训练和微调大型语言模型 (LLMs)。
目标: 开发AI系统的批判性思维能力，模拟现实世界的决策挑战，训练模型处理结构化数据和多选推理任务。

数据集结构

格式: JSONL (JSON Lines)
特征:
- context: 详细场景，需要逻辑推理、模式识别和推断。
- query: 聚焦的问题，要求对上下文进行分析评估。
- options: 四个多选答案，包括一个正确答案和三个干扰项。
- correct_option: 整数索引 (0–3)，标识正确答案。
示例记录: json { "context": "A company reported a ransomware attack after an employee downloaded an attachment from an unknown sender. Logs show unusual outbound traffic from the employees machine to an external IP (192.168.1.10) and encrypted files were detected.", "query": "What is the most likely cause of the incident?", "options": [ "The employee opened a phishing email containing malware.", "The employee intentionally installed ransomware.", "The IT team misconfigured the firewall settings.", "A system update triggered the ransomware activation." ], "correct_option": 0 }

数据集统计

示例数量: 10,000 (可扩展)
训练集大小: 2,263,973 字节
训练集示例数量: 1,895
下载大小: 900,325 字节
数据集大小: 2,263,973 字节

应用领域

人工智能研究: 基准测试逻辑推理和分析决策能力，微调大型语言模型 (LLMs)。
网络安全培训: 开发AI系统进行威胁分析和事件调查，模拟数字取证和恶意软件检测场景。
教育工具: 培训系统用于批判性思维课程，评估学生和专业人士的逻辑推理技能。
决策支持系统: 构建AI驱动的工具用于复杂决策环境，协助涉及数据泄露、网络钓鱼和欺诈检测的调查。

数据集生成过程

生成工具: GPT-4
生成步骤:
1. 科学提示工程，确保模式合规。
2. 验证步骤，确保结构完整性。
3. 人工参与的质量保证，随机样本进行手动审查。

使用方式

下载数据集: bash git clone https://huggingface.co/datasets/theeseus-ai/CriticalThinker cd CriticalThinker
在Python中加载数据集: python from datasets import load_dataset dataset = load_dataset(theeseus-ai/CriticalThinker) print(dataset[0])
模型微调示例: python from transformers import AutoModelForMultipleChoice, AutoTokenizer, Trainer, TrainingArguments

model = AutoModelForMultipleChoice.from_pretrained("bert-base-uncased") tokenizer = AutoTokenizer.from_pretrained("bert-base-uncased")

Tokenize dataset and prepare for training

Add training scripts as per requirements

许可证

许可证类型: Apache 2.0 License

引用

bibtex @dataset{critical_thinking_synthetic, author = {Theeseus AI}, title = {Critical Thinking Synthetic Dataset}, year = {2024}, version = {1.0}, publisher = {HuggingFace Datasets}, url = {https://huggingface.co/datasets/theeseus-ai/CriticalThinker} }

联系方式

电子邮件: theeseus@protonmail.com
LinkedIn: Theeseus

搜集汇总

数据集介绍

构建方式

Critical Thinking Synthetic Dataset 是通过GPT-4生成的合成数据集，采用程序化管道进行构建。其生成过程包括科学提示工程、严格的JSON验证以及人工质量保证环节。提示设计专注于数字调查和批判性思维任务，确保每个数据点符合预定义的JSON模式。通过人工审查随机样本，进一步提升了数据集的质量和可靠性。

特点

该数据集的特点在于其结构化的多选推理任务设计，每个数据点包含一个复杂场景、一个直接相关的问题、四个选项以及一个正确答案索引。场景设计旨在测试逻辑推理、模式识别和推断能力，问题则要求对场景进行深入分析。选项包括一个正确答案和三个干扰项，挑战模型的推理能力。数据集覆盖了网络安全、逻辑推理、伦理决策等多个领域，适用于多种认知推理任务。

使用方法

使用该数据集时，用户可以通过Hugging Face平台下载并加载数据集。数据集以JSONL格式存储，便于在Python环境中使用`datasets`库进行加载和处理。用户可以利用该数据集进行模型微调，例如使用BERT等预训练模型进行多选任务训练。通过结合`transformers`库，用户可以轻松实现数据集的预处理、模型训练和评估，从而提升模型在批判性思维任务中的表现。

背景与挑战

背景概述

Critical Thinking Synthetic Dataset 是由 Theeseus AI 于 2024 年发布的高质量机器生成数据集，旨在增强和评估逻辑推理、分析思维和问题解决能力。该数据集特别适用于训练和微调大型语言模型（LLMs），重点关注决策、推理和多层次推理过程。其核心研究问题在于如何通过复杂、多层次的场景模拟，提升人工智能系统在真实世界决策中的表现。该数据集在认知推理任务中作为基准，推动了人工智能在逻辑推理、网络安全、数据分析和伦理决策等领域的研究与应用。

当前挑战

Critical Thinking Synthetic Dataset 面临的挑战主要体现在两个方面。其一，该数据集旨在解决人工智能系统在复杂决策和逻辑推理任务中的表现问题，然而，如何确保模型在面对模糊性和多选项推理时能够准确推断出正确答案，仍是一个技术难点。其二，在数据集的构建过程中，尽管采用了 GPT-4 进行程序化生成，并通过科学提示工程和人工质量保证进行验证，但如何确保生成场景的多样性和真实性，同时避免数据偏差和错误，仍然是一个复杂的挑战。此外，数据集的扩展性和跨领域适用性也需要进一步优化，以满足不同应用场景的需求。

常用场景

经典使用场景

CriticalThinker数据集在人工智能研究领域中被广泛用于训练和评估大型语言模型的逻辑推理和分析能力。通过提供复杂的多选推理任务，该数据集能够帮助模型在模拟真实世界决策挑战中提升其推理和问题解决能力。特别是在网络安全、数据分析和调查性问题的解决中，数据集的应用尤为突出。

衍生相关工作

CriticalThinker数据集衍生了一系列相关研究工作，特别是在大型语言模型的微调和评估方面。基于该数据集的研究成果包括开发更高效的推理模型、提升模型在复杂情境下的决策能力，以及在网络安全和数字取证领域的应用研究。此外，数据集还推动了在教育和培训领域中使用AI技术进行批判性思维训练的相关研究。

数据集最近研究