CPC15, CPC18, choices13k
收藏github2024-05-21 更新2024-05-31 收录
下载链接:
https://github.com/RothkopfLab/DatasetBias
下载链接
链接失效反馈官方服务:
资源简介:
本研究中使用的三个公开数据集,用于分析机器学习理论中的经济决策偏差。
The three publicly available datasets utilized in this study are employed to analyze economic decision biases within the framework of machine learning theory.
创建时间:
2023-09-21
原始信息汇总
数据集概述
数据集名称
- CPC15
- CPC18
- choices13k
数据集来源
数据集存储位置
- 所有数据集的聚合版本,不包含个体数据,并增加了额外特征和一些效用列,存储在data文件夹中。
数据集用途
- 用于研究机器学习理论中的经济决策模型偏差。
相关研究
- 研究论文:Modelling dataset bias in machine-learned theories of economic decision-making
- 作者:T. Thomas, D. Straub, F. Tatai, M. Shene, T. Tosik, K. Kersting, C. A. Rothkopf
- 发表期刊:Nature Human Behaviour (2024)
- DOI: 链接
搜集汇总
数据集介绍

构建方式
在构建CPC15、CPC18和choices13k数据集时,研究团队采用了公开可用的原始数据,并进行了聚合处理。这些数据集源自多个经济决策实验,涵盖了广泛的经济行为研究领域。通过去除个体数据并添加额外的特征和效用列,数据集被进一步处理以适应机器学习模型的需求。这种处理方式确保了数据集的多样性和代表性,为后续的经济决策模型训练提供了坚实的基础。
特点
CPC15、CPC18和choices13k数据集的主要特点在于其广泛的应用范围和丰富的数据特征。这些数据集不仅包含了大量的经济决策实验数据,还通过聚合处理和特征添加,增强了数据的可分析性和可解释性。此外,数据集的公开可用性使得研究者能够自由访问和使用,促进了经济决策理论的进一步发展和验证。
使用方法
使用这些数据集进行分析和模型训练时,用户首先需要安装指定的conda环境,通过运行`conda env create -f environment.yml`和`conda activate DecisionMaking`命令来配置所需的环境。随后,用户可以利用提供的Jupyter笔记本进行数据分析和模型训练,这些笔记本详细展示了如何重现论文中的图表和分析结果。此外,预训练模型和相关源代码也已提供,方便用户进行进一步的研究和应用。
背景与挑战
背景概述
在经济决策理论的研究领域,机器学习模型的应用日益广泛,旨在通过数据驱动的方法揭示人类决策行为的内在机制。CPC15、CPC18和choices13k数据集由Thomas等人于2024年创建,这些数据集的公开发布为研究者提供了丰富的资源,用以探索和验证经济决策模型。这些数据集不仅包含了大量的决策实例,还通过添加额外的特征和效用列,增强了数据集的分析能力。该研究的核心问题在于如何通过机器学习模型准确捕捉和解释经济决策中的数据偏差,从而提升模型的预测精度和理论解释力。这一研究对经济学和人工智能交叉领域的研究具有重要影响,推动了理论与实践的结合。
当前挑战
尽管CPC15、CPC18和choices13k数据集为经济决策研究提供了宝贵的资源,但在其构建和应用过程中仍面临诸多挑战。首先,数据集的偏差问题是一个核心挑战,如何识别和校正这些偏差以确保模型的公正性和准确性是当前研究的重点。其次,数据集的多样性和复杂性增加了模型训练的难度,要求研究者开发更为精细和鲁棒的算法。此外,数据集的公开性和可访问性虽然促进了研究的透明度,但也带来了数据隐私和伦理方面的考量,如何在保护个体隐私的同时进行有效的数据分析,是当前亟需解决的问题。
常用场景
经典使用场景
在经济决策理论的研究领域,CPC15、CPC18和choices13k数据集被广泛应用于构建和验证机器学习模型。这些数据集通过模拟人类在经济决策中的行为,为研究人员提供了一个丰富的实验平台。经典的使用场景包括利用这些数据集训练和测试各种经济决策模型,如效用理论、前景理论等,以评估模型在不同情境下的预测能力和解释力。
解决学术问题
这些数据集解决了经济决策理论中的关键学术问题,如数据偏差对模型预测准确性的影响。通过分析这些数据集,研究人员能够识别和量化数据偏差,从而改进模型的鲁棒性和泛化能力。此外,这些数据集还为探索人类决策行为的多样性和复杂性提供了宝贵的资源,推动了经济心理学和行为经济学的发展。
衍生相关工作
基于CPC15、CPC18和choices13k数据集,许多相关研究工作得以展开。例如,有研究利用这些数据集开发了新的经济决策模型,以更好地捕捉人类决策的非理性特征;还有研究通过这些数据集验证了现有模型的改进版本,提升了模型的预测精度。这些衍生工作不仅丰富了经济决策理论的研究内容,也为实际应用提供了更多可能性。
以上内容由遇见数据集搜集并总结生成



