five

Charon107/Financial_Parameter_From_Moneycontrol

收藏
Hugging Face2024-06-18 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Charon107/Financial_Parameter_From_Moneycontrol
下载链接
链接失效反馈
官方服务:
资源简介:
Financial Parameter Database包含了过去五年(2019-2023)来自992家公司的财务报表和参数,总计4,960个数据集,其中训练集包含3,968个数据集,测试集包含992个数据集。每个数据集包含公司的年度报告,标签是从这些文档中提取的特定财务参数。数据集包括三个属性:`CompanyName_Year`、`text`和`label`。数据来源于印度国家证券交易所(NSE),并经过预处理以消除停用词和特殊符号。该数据集旨在帮助训练专注于分析财务报告的文本到文本生成的NLP模型。

Financial Parameter Database包含了过去五年(2019-2023)来自992家公司的财务报表和参数,总计4,960个数据集,其中训练集包含3,968个数据集,测试集包含992个数据集。每个数据集包含公司的年度报告,标签是从这些文档中提取的特定财务参数。数据集包括三个属性:`CompanyName_Year`、`text`和`label`。数据来源于印度国家证券交易所(NSE),并经过预处理以消除停用词和特殊符号。该数据集旨在帮助训练专注于分析财务报告的文本到文本生成的NLP模型。
提供机构:
Charon107
原始信息汇总

Financial Parameter Database Overview

概述

该数据库包含992家公司过去五年(2019-2023年)的财务报表和参数,总计4,960个数据集。训练集包含3,968个数据集,测试集包含992个数据集。此数据库专为训练专注于分析财务报告的文本到文本生成NLP模型而设计。

数据描述

每个数据集包含一家公司的年度报告。每个数据集的标签由从这些文档中提取的特定财务参数组成。这些财务参数包括但不限于:权益和负债、资产、收入、费用以及各种财务比率,如每股收益(EPS)、市盈率(P/E)比率和流动性比率。

每个数据集包含三个属性:CompanyName_Yeartextlabel

  • CompanyName_Year:此属性表示公司的符号加上财政年度,格式如3MINDIA_2021
  • text:此属性包含公司的年度报告文本。
  • label:此属性包含从年度报告中提取的财务参数。

数据源

年度报告来源于NSE(印度国家证券交易所),经过预处理以消除停用词和特殊符号,提高模型训练的清晰度和效率。数据的标签,即详细的财务数据,来源于Moneycontrol

财务参数概览

权益和负债

  • 股东资金
  • 非流动负债
  • 流动负债

资产

  • 非流动资产
  • 流动资产

额外财务信息

  • 或有负债、承诺

收入和费用

  • 营业收入(总和净)
  • 其他收入
  • 总收入
  • 费用分解
  • 税前和税后利润/亏损

比率和其它指标

  • 每股数据
  • 盈利能力比率
  • 流动性和偿债比率
  • 估值比率
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作