Risky_Choices

Hugging Face2024-08-12 更新2024-12-12 收录

下载链接：

https://huggingface.co/datasets/Josephgflowers/Risky_Choices

下载链接

链接失效反馈

官方服务：

资源简介：

Risky Choices数据集是从原始的choices13k数据集衍生出来的版本，旨在帮助训练语言模型进行决策推理、解释生成和自然语言处理等任务。该数据集包含13,006个风险选择问题，以适合各种AI和ML应用的自然语言格式重新构建。每个条目都以决策场景的形式呈现，并附有对所选选项的推理，数据集以文本和CSV格式提供。该数据集支持自然语言处理训练、微调和评估等任务，并包括系统提示和用户提示，以便模型生成解释或推理。

The Risky Choices dataset is a derivative variant of the original choices13k dataset, designed to assist in training language models for tasks such as decision-making reasoning, explanation generation, and natural language processing (NLP). This dataset contains 13,006 risky choice questions, which have been reconstructed into natural language formats suitable for various AI and ML applications. Each entry is presented in the form of a decision scenario, paired with reasoning for the selected option. The dataset is available in both text and CSV formats. It supports tasks including NLP training, fine-tuning and evaluation, and includes system prompts and user prompts to enable models to generate explanations or reasoning.

创建时间：

2024-08-12

原始信息汇总

Risky Choices 数据集概述

数据集简介

Risky Choices 数据集是从原始的 choices13k 数据集衍生而来的版本。该数据集旨在帮助训练用于决策推理、解释生成和自然语言处理等任务的语言模型。数据集包含 13,006 个风险选择问题的人类决策率，并以适合各种 AI 和 ML 应用的自然语言格式重新构建。

关键特性

自然语言格式：数据集提供自然语言的决策场景，允许模型为参与者的决策生成解释。
系统与用户提示：每个场景都包含系统提示和用户提示，随后是模型生成的解释或推理。

支持的任务

自然语言处理（NLP）
决策推理
解释生成
数据增强

源数据

原始数据集 choices13k 由 Joshua C. Peterson、David D. Bourgin、Mayank Agrawal、Daniel Reichman 和 Thomas L. Griffiths 编译。它包含 13,006 个风险选择问题的人类决策率，按照人类决策文献中的最佳实践收集。

引用

如果您使用 Processed Choices13k 数据集，请同时引用原始数据集：

bibtex @article{Peterson2021a, title = {Using large-scale experiments and machine learning to discover theories of human decision-making}, author = {Peterson, Joshua C. and Bourgin, David D. and Agrawal, Mayank and Reichman, Daniel and Griffiths, Thomas L.}, volume = {372}, number = {6547}, pages = {1209--1214}, year = {2021}, doi = {10.1126/science.abe2629}, issn = {0036-8075}, journal = {Science} }

@InProceedings{Bourgin2019a, title = {Cognitive model priors for predicting human decisions}, author = {Bourgin, David D. and Peterson, Joshua C. and Reichman, Daniel and Russell, Stuart J. and Griffiths, Thomas L.}, booktitle = {Proceedings of the 36th International Conference on Machine Learning}, pages = {5133--5141}, year = {2019}, volume = {97}, series = {Proceedings of Machine Learning Research}, month = {09--15 Jun}, publisher = {PMLR}, }

语言

数据集为英语，源自向参与者展示的决策场景。

搜集汇总

数据集介绍

构建方式

Risky_Choices数据集源自choices13k数据集，经过重新构建以适应自然语言处理任务的需求。该数据集包含13,006个风险决策问题的人类决策率，每个问题被转化为自然语言格式的决策场景，并附有相应的推理过程。数据以文本和CSV格式提供，便于在多种AI和机器学习任务中使用。

特点

Risky_Choices数据集的特点在于其自然语言格式的决策场景，每个场景均包含系统提示和用户提示，随后是模型生成的解释或推理。这种结构使得该数据集特别适合用于训练语言模型进行决策推理和解释生成任务。此外，数据集的多格式支持使其在NLP训练、微调和评估中具有广泛的应用潜力。

使用方法

Risky_Choices数据集可用于多种自然语言处理任务，包括决策推理和解释生成。用户可以通过加载文本或CSV格式的数据，利用系统提示和用户提示来训练或评估模型。此外，该数据集还支持数据增强任务，帮助提升模型在复杂决策场景中的表现。

背景与挑战

背景概述

Risky_Choices数据集源自于choices13k数据集，旨在支持语言模型在决策推理、解释生成及自然语言处理等任务中的训练。该数据集由Joshua C. Peterson、David D. Bourgin等研究人员于2021年创建，收录了13,006个风险决策问题的人类决策数据，并以自然语言形式重构，适用于多种AI和机器学习应用。数据集的核心研究问题聚焦于人类在风险决策中的行为模式及其背后的认知机制，为心理学、行为经济学及人工智能领域提供了重要的数据支持。其影响力不仅体现在推动了决策理论的研究，还为AI模型的解释能力提供了新的训练资源。

当前挑战

Risky_Choices数据集在解决风险决策问题的同时，也面临多重挑战。首先，风险决策本身具有高度复杂性和主观性，如何准确捕捉人类决策的多样性和不确定性是核心难题。其次，数据集的构建过程中，将原始决策数据转化为自然语言形式时，需确保语义的准确性和一致性，这对数据处理和标注提出了较高要求。此外，尽管数据集提供了丰富的决策场景，但其样本的多样性和代表性仍需进一步验证，以避免模型训练中的偏差问题。最后，如何利用该数据集提升AI模型的解释能力，尤其是在生成可信且符合人类逻辑的决策解释方面，仍是一个亟待解决的技术挑战。

常用场景

经典使用场景

Risky_Choices数据集在自然语言处理（NLP）领域中被广泛用于训练和评估模型在决策推理和解释生成任务中的表现。通过提供自然语言格式的决策场景，该数据集使得模型能够模拟人类在风险选择中的决策过程，并生成相应的解释。这种格式不仅适用于传统的NLP任务，还为模型在复杂决策环境中的表现提供了基准。

衍生相关工作

基于Risky_Choices数据集，许多经典研究工作得以展开。例如，Peterson等人利用该数据集开发了大规模实验和机器学习方法，用于发现人类决策理论。此外，Bourgin等人提出了认知模型先验，用于预测人类决策行为。这些研究不仅推动了决策科学的前沿，还为后续的AI模型开发提供了理论基础。

数据集最近研究