FAR-Trans
收藏arXiv2024-07-12 更新2024-07-14 收录
下载链接:
https://doi.org/10.5525/gla.researchdata.1658
下载链接
链接失效反馈官方服务:
资源简介:
FAR-Trans数据集由格拉斯哥大学和希腊国家银行联合创建,是首个公开的金融资产推荐数据集,包含股票、债券和共同基金的定价信息及投资者交易记录。数据集涵盖了2018年至2022年间希腊投资者可接触的市场数据,包括807种资产的详细信息和388,049条交易记录。创建过程中,数据经过严格清洗和预处理,确保数据的准确性和可用性。该数据集主要用于金融资产推荐系统的研究和开发,旨在通过提供真实交易数据来促进算法比较和模型评估。
The FAR-Trans dataset, jointly created by the University of Glasgow and the National Bank of Greece, is the first publicly available financial asset recommendation dataset. It includes pricing information and investor transaction records for stocks, bonds, and mutual funds. Covering market data accessible to Greek investors between 2018 and 2022, the dataset contains detailed information on 807 assets and 388,049 transaction records. During its development, the data underwent rigorous cleaning and preprocessing to ensure its accuracy and usability. This dataset is primarily used for the research and development of financial asset recommendation systems, aiming to facilitate algorithm comparison and model evaluation by providing real transaction data.
提供机构:
格拉斯哥大学
创建时间:
2024-07-12
原始信息汇总
FAR-Trans: An Investment Dataset for Financial Asset Recommendation
概述
- 标题: FAR-Trans: An Investment Dataset for Financial Asset Recommendation
- 创建者:
- Sanz-Cruzado Puig, Javier
- Droukas, Nikolaos
- Mccreadie, Richard
- 发布日期: 2024-06-21
- 发布机构: University of Glasgow
- 数据集类型: Data Collection
- 语言: English
- 版权持有者: National Bank of Greece
- 数据集描述: 该数据集包括金融证券(股票、债券和共同基金)的基本信息、这些资产的定价时间序列、客户信息和由一家大型欧洲金融机构提供的投资交易。
详细信息
- 数据集内容:
- 金融证券的基本信息
- 定价时间序列
- 客户信息
- 投资交易记录
- 数据来源: 一家大型欧洲金融机构
- 数据集ID: 10.5525/gla.researchdata.1658
- 数据文件:
引用信息
- 引用格式:
- Sanz-Cruzado Puig, J., Droukas, N. and Mccreadie, R. (2024) FAR-Trans: An Investment Dataset for Financial Asset Recommendation. [Data Collection]
搜集汇总
数据集介绍

构建方式
FAR-Trans数据集的构建方式涉及从一家大型欧洲金融机构获取的价格信息和零售投资者交易记录。数据集涵盖了股票、债券和共同基金的价格数据,以及该机构处理的资产买卖行为。数据清洗和预处理过程包括去除重复值、处理价格时间序列中的缺失值和异常值,以及处理股票分割和货币变动。此外,数据集还包括客户信息,如投资风险偏好和投资能力,这些信息通过银行内部客户分类和投资评估问卷获得。所有客户信息均已匿名化以保护隐私。
特点
FAR-Trans数据集的特点在于其全面性,它包含了资产价格时间序列、资产描述、匿名客户信息以及投资交易记录。数据集涵盖了2018年1月至2022年11月期间的市场情况,包括牛市和熊市,以及受到外部事件如新冠疫情和俄乌战争影响的市场。此外,数据集还提供了客户分类、投资风险偏好和投资能力的详细信息,这些信息对于研究投资者行为和开发个性化的推荐系统至关重要。
使用方法
FAR-Trans数据集的使用方法包括投资者建模、金融资产推荐和投资组合管理等。对于金融资产推荐任务,数据集可以用于开发和评估基于价格、基于交易和混合模型。此外,数据集还可以用于研究投资者行为和开发个性化的投资建议系统。为了促进研究,论文中提供了一个推荐实验设置和11个基准FAR方法的比较,以供未来研究参考。
背景与挑战
背景概述
金融资产推荐(FAR)是推荐系统的一个子领域,旨在为投资者识别有价值的金融证券,并期望他们能在推荐资产上进行资本投资。FAR解决方案分析并从多个数据源学习,包括时间序列定价数据、客户资料信息和预期,以及过去的投资。然而,大多数模型都是在专有数据集上开发的,使得在公共基准上进行比较变得不可能。在本论文中,我们通过引入FAR-Trans来解决这一问题,这是第一个公开的FAR数据集,包含从一家大型欧洲金融机构获得的定价信息和零售投资者交易。我们还提供了11个FAR算法在数据上的基准比较,供未来使用。该数据集可从https://doi.org/10.5525/gla.researchdata.1658下载。
当前挑战
FAR-Trans数据集的创建旨在解决FAR领域中缺乏公开数据集的问题,以便研究人员能够在共同的基准上开发和评估新的FAR模型。尽管该数据集提供了资产定价信息和投资交易数据,但仍然存在一些挑战。首先,构建过程中遇到了数据清洗和预处理的挑战,以确保数据的一致性和准确性。其次,隐私保护也是一个重要的挑战,因为客户和交易信息需要被匿名化以遵守法规。最后,由于FAR是一个复杂的领域,涉及多种信息源和算法,因此评估和比较不同模型的性能也是一个挑战。
常用场景
经典使用场景
FAR-Trans数据集的经典使用场景是金融资产推荐(FAR)。该数据集包含了从大型欧洲金融机构获取的定价信息和零售投资者交易数据,为研究人员提供了评估和开发新型FAR模型的基准数据。FAR-Trans数据集可以用于训练和评估基于价格、基于交易和混合模型的FAR方法,帮助投资者识别适合其投资目标和风险偏好的金融证券。
实际应用
FAR-Trans数据集的实际应用场景包括投资组合管理、投资者建模和金融资产推荐。投资组合管理涉及构建符合客户投资目标和风险偏好的投资组合,而投资者建模则可以帮助金融机构更好地了解客户行为和偏好。金融资产推荐则是FAR-Trans数据集的主要应用场景,可以帮助投资者识别适合其投资目标和风险偏好的金融证券。此外,FAR-Trans数据集还可以用于评估投资预测模型的性能,以及研究投资者和资产的行为模式。
衍生相关工作
FAR-Trans数据集的发布推动了金融资产推荐领域的研究和开发,衍生出了许多相关工作。例如,一些研究使用FAR-Trans数据集评估和比较了不同FAR方法的性能,并提出了改进FAR模型的方法。此外,一些研究还使用FAR-Trans数据集研究了投资者和资产的行为模式,以及投资组合的构建和优化问题。这些相关工作不仅推动了FAR领域的发展,也为金融服务的数字化转型提供了支持。
以上内容由遇见数据集搜集并总结生成



