sovai/news_sentiment
收藏Sovais Open Investment Datasets
数据集概述
Sovais Open Investment Datasets 提供了多个用于投资研究的开源数据集。这些数据集涵盖了新闻情感、价格突破、内幕交易预测、机构交易、游说数据、卖空、维基百科浏览量、制药临床试验、因子信号、财务比率、政府合同、公司风险、全球风险、消费者金融投诉、风险指标、政府网站流量、盈利惊喜和破产预测等多个领域。
数据集列表
| 图标 | 数据集名称 | 描述 | 文档 | 价格(每月) |
|---|---|---|---|---|
| 📰 | sovai/news_sentiment | 包含两种新闻数据集,一种是股票代码匹配的,另一种是主题匹配的。 | 文档 | $200 |
| 📈 | sovai/price_breakout | 每日更新的美国股票价格突破预测数据集。 | 文档 | $220 |
| 🔍 | sovai/insider_flow_prediction | 包含超过60个内幕交易特征,包括流量预测值。 | 文档 | $465 |
| 💼 | sovai/institutional_trading | 提供机构投资行为、策略和投资组合动态的全面分析。 | 文档 | $580 |
| 📢 | sovai/lobbying_data | 股票代码匹配的游说数据,用于观察细粒度的公司游说行为。 | 文档 | $645 |
| 🔽 | sovai/short_selling | 用于风险分析的多种卖空数据集。 | 文档 | $780 |
| 📖 | sovai/wikipedia_views | 一些最大公司的每日维基百科页面浏览量和趋势。 | 文档 | $200 |
| 💊 | sovai/pharma_clinical_trials | 标记临床试验及其预测结果成功率的独特数据集。 | 文档 | $850 |
| 📊 | sovai/factor_signals | 包含传统会计因子、替代财务指标和高级统计分析,支持复杂的财务建模。 | 文档 | $270 |
| 📉 | sovai/financial_ratios | 超过80个从财务报表和市场数据计算的财务比率。 | 文档 | $270 |
| 📜 | sovai/government_contracts | 公开交易公司的政府合同数据。 | 文档 | $580 |
| ⚠️ | sovai/corp_risks | 超过13,000家美国公开交易股票的第7章和第11章破产预测。 | 文档 | $270 |
| 🛡️ | sovai/risks | 每日更新的全球风险感知,使用领先指标和高级模型预测各种类型的风险。 | 文档 | $270 |
| 💬 | sovai/cfpb_complaints | 消费者金融投诉的股票代码映射数据集。 | 文档 | $480 |
| 🧮 | sovai/risk_indicators | 通过分析公司事件构建的美国股票综合风险评分。 | 文档 | $270 |
| 🚦 | sovai/traffic_agencies | 政府网站机构流量的数据。 | 文档 | $250 |
| 👥 | sovai/earnings_surprise | 从外部来源获取的盈利公告以及实际公告前的估计信息。 | 文档 | $680 |
| ❗ | sovai/bankruptcy | 超过5,000家美国公开交易股票的第7章和第11章破产预测。 | 文档 | $270 |
使用示例
以下是使用 Hugging Face datasets 库加载每个数据集的示例代码片段:
-
📰 sovai/news_sentiment python from datasets import load_dataset df_news_sentiment = load_dataset("sovai/news_sentiment", split="train").to_pandas()
-
📈 sovai/price_breakout python from datasets import load_dataset df_price_breakout = load_dataset("sovai/price_breakout", split="train").to_pandas()
-
🔍 sovai/insider_flow_prediction python from datasets import load_dataset df_insider_flow = load_dataset("sovai/insider_flow_prediction", split="train").to_pandas()
-
💼 sovai/institutional_trading python from datasets import load_dataset df_institutional_trading = load_dataset("sovai/institutional_trading", split="train").to_pandas()
-
📢 sovai/lobbying_data python from datasets import load_dataset df_lobbying_data = load_dataset("sovai/lobbying_data", split="train").to_pandas()
-
🔽 sovai/short_selling python from datasets import load_dataset df_short_selling = load_dataset("sovai/short_selling", split="train").to_pandas()
-
📖 sovai/wikipedia_views python from datasets import load_dataset df_wikipedia_views = load_dataset("sovai/wikipedia_views", split="train").to_pandas()
-
💊 sovai/pharma_clinical_trials python from datasets import load_dataset df_pharma_trials = load_dataset("sovai/pharma_clinical_trials", split="train").to_pandas()
-
📊 sovai/factor_signals python from datasets import load_dataset df_factor_signals = load_dataset("sovai/factor_signals", split="train").to_pandas()
-
📉 sovai/financial_ratios python from datasets import load_dataset df_financial_ratios = load_dataset("sovai/financial_ratios", split="train").to_pandas()
-
📜 sovai/government_contracts python from datasets import load_dataset df_government_contracts = load_dataset("sovai/government_contracts", split="train").to_pandas()
-
⚠️ sovai/corp_risks python from datasets import load_dataset df_corp_risks = load_dataset("sovai/corp_risks", split="train").to_pandas()
-
🛡️ sovai/risks python from datasets import load_dataset df_risks = load_dataset("sovai/risks", split="train").to_pandas()
-
💬 sovai/cfpb_complaints python from datasets import load_dataset df_cfpb_complaints = load_dataset("sovai/cfpb_complaints", split="train").to_pandas()
-
🧮 sovai/risk_indicators python from datasets import load_dataset df_risk_indicators = load_dataset("sovai/risk_indicators", split="train").to_pandas()
-
🚦 sovai/traffic_agencies python from datasets import load_dataset df_traffic_agencies = load_dataset("sovai/traffic_agencies", split="train").to_pandas()
-
👥 sovai/earnings_surprise python from datasets import load_dataset df_earnings_surprise = load_dataset("sovai/earnings_surprise", split="train").to_pandas()
-
❗ sovai/bankruptcy python from datasets import load_dataset df_bankruptcy = load_dataset("sovai/bankruptcy", split="train").to_pandas()




