five

Mutual Fund Portfolio Dataset

收藏
github2025-01-21 更新2025-02-19 收录
下载链接:
https://github.com/captn3m0/mf-portfolio
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个关于印度共同基金投资组合数据的数据集,旨在从各个资产管理公司(AMC)的网站上转换投资组合信息成为一个具有可用标识符(ISINs)的实时数据集。

This dataset focuses on the portfolio data of Indian mutual funds, with the goal of converting portfolio information retrieved from the official websites of various Asset Management Companies (AMCs) into a real-time dataset equipped with usable identifiers (ISINs).
创建时间:
2025-01-20
原始信息汇总

Mutual Fund Portfolio Dataset 概述

数据集简介

Mutual Fund Portfolio Dataset 是一个关于印度共同基金投资组合数据的数据集。该数据集旨在将印度各个资产管理公司(AMC)网站上披露的投资组合信息转换为机器可读的格式,并使用可用的标识符(ISINs)。

数据集特点

  • 针对印度市场上较大的资产管理公司(前10名AMCs覆盖超过70%的总资产管理规模)。
  • 虽然历史数据重要,但当前重点在于获取最新的原始数据源(Excel表格)。
  • 自动化更新是关键,目标是AMC网站更新数据后一天内完成数据更新。
  • 数据发布格式为CSV/SQLite,并提供可用的API。

数据处理

  • 将证券映射到ISINs是一个难点,因为并非所有AMCs都公布基础证券的ISIN。

相关项目

  • Mutual Fund TER Tracker:跟踪印度共同基金的TER(总费用比率)。
  • Kuveras Mutual Fund Identifiers:将Kuvera的共同基金标识符映射到ISINs。
  • Historical Mutual Fund NAV Data:历史共同基金净值数据。
  • Mutual Funds API:提供上述部分数据的API。
  • India ISIN Dataset:印度ISIN数据集,包含每个ISIN的最小详细信息。

许可

  • 代码遵循MIT许可证。数据集的最终许可尚待确定。

MIT License

搜集汇总
数据集介绍
main_image_url
构建方式
Mutual Fund Portfolio Dataset的构建,旨在将印度共同基金投资组合信息转化为机器可读的数据集。该过程优先考虑资产管理规模较大的AMCs,关注自动化更新,并计划从AMCs网站获取原始数据源(Excel表格),进而进行解析,最终以CSV/SQLite格式发布,并提供实用的API。
特点
该数据集的特点在于,它为研究者和开发者提供了一个有关印度共同基金投资组合的全面视角,包含了证券及其持有比例的信息。尽管不是所有AMCs都公布基础证券的ISIN,但数据集通过映射证券到ISINs,增强了数据的一致性和可用性。此外,数据集的实时更新和丰富的历史数据,使其成为分析和研究的宝贵资源。
使用方法
用户可以通过访问数据集的GitHub页面获取代码和文档,了解如何使用API来获取数据。数据集以开放源代码的方式提供,用户需遵循MIT License。在使用数据集时,用户可以根据需要选择CSV或SQLite格式,以便于集成到自己的研究和应用中。
背景与挑战
背景概述
Mutual Fund Portfolio Dataset是一个针对印度共同基金投资组合信息的专门数据集。在印度,共同基金必须公开其投资组合信息,包括基础证券及其持股比例。然而,在此之前,并未存在一个可供机器读取的数据源提供此类信息。该数据集的创建旨在填补这一空白,由一系列研究人员或机构通过抓取各大资产管理公司(AMC)网站上的投资组合信息,并尝试将其转化为带有可用标识符(如ISINs)的实际数据集。该数据集的创建对于金融科技领域、投资分析及市场监管等方面具有重要的研究价值。
当前挑战
该数据集在构建过程中面临的主要挑战包括:1)自动化抓取并更新AMC网站上的数据,保证数据的时效性;2)解析并转换抓取到的原始数据(如Excel表格)为更通用的CSV或SQLite格式;3)映射证券到ISINs的难题,因为并非所有的AMC都会公开基础证券的ISIN;4)数据集的构建还需解决如何高效地处理历史数据,以及如何提供一个可用API来服务上述数据。这些挑战的存在,使得该数据集的构建成为一个复杂且持续更新的任务。
常用场景
经典使用场景
在金融科技领域,Mutual Fund Portfolio Dataset数据集的典型应用场景在于构建与优化投资组合模型。通过对 mutual funds 投资组合的详细数据进行分析,研究者能够深入理解基金管理者的资产配置策略,从而设计出更加科学合理的投资策略。
衍生相关工作
基于该数据集,已经衍生出多项相关工作,包括但不限于Mutual Fund TER Tracker,用于追踪基金的费用比率;Kuvera's Mutual Fund Identifiers,将基金标识映射至ISIN;以及Mutual Funds API,提供数据服务接口等。这些相关工作进一步拓展了数据集的应用范围,促进了金融科技的发展。
数据集最近研究
最新研究方向
Mutual Fund Portfolio Dataset 数据集的构建,旨在解决印度共同基金领域缺乏机器可读数据源的问题。该数据集通过将各大资产管理公司(AMC)网站上的投资组合信息转化为具有可用标识符(ISINs)的实际数据集,为研究者提供了宝贵的资源。当前研究方向的焦点在于自动化抓取AMC网站的原始数据源,并尽快更新数据,同时解析文件并以CSV/SQLite格式发布,并构建可用API。该数据集对于推进投资组合分析、风险管理以及市场监控等前沿研究方向具有重要影响,为金融科技领域的研究提供了新的视角和数据支撑。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作