five

Financial World Archive - 1902-1930

收藏
Snowflake2026-04-20 更新2026-04-21 收录
下载链接:
https://app.snowflake.com/marketplace/listing/GZSXZGPW43P8
下载链接
链接失效反馈
官方服务:
资源简介:
Complete pre-1930 archive of Financial World, an early 20th-century financial newspaper exposing investment fraud, stock manipulation, and market speculation. **121,354 rows** of clean, structured text documenting the rise of modern American finance. **What this data does for your model:** - Your model learns authentic early 20th‑century investigative financial journalism, exposing frauds and warning investors. - Your model retrieves original reporting on bucket shops, stock swindlers, fake mining companies, and "guaranteed return" schemes. - Your model trains on the language of market manipulation, learning to recognize red flags in investment promotions. - Your model understands the watchdog voice of financial reporting before SEC regulation, when journalists were the primary check on fraud. **What's inside:** - Exposés of fraudulent investment schemes and stock promoters - The Texas oil boom, Beaumont, Spindle Top, J.P. Morgan vs. Rockefeller - Mining fraud - Thunder Mountain, Colorado promoters - Railroad finance and industrial consolidation - Early consumer protection journalism **Perfect for:** - LLM fine-tuning on financial history and journalism - Fraud detection AI training (historical patterns) - Economic history and market research - Investigative journalism and media studies **Format:** Snowflake-native JSONL with columns: ISSUE, TITLE, AUTHOR, TYPE, TEXT. Fully cleaned, bias-audited, and ready for AI training. *From the 1902 Texas oil boom to the eve of the Great Depression - financial journalism that warned investors, now ready for AI.* <p><br/></p>
提供机构:
Devin Media Corp.
创建时间:
2026-04-18
原始信息汇总

Financial World Archive - 1902-1930 数据集概述

数据集基本信息

  • 数据集名称: Financial World Archive - 1902-1930
  • 副标题: Early 20th-Century Financial Journalism - 1902 to 1930
  • 提供商: Devin Media Corp.
  • 数据规模: 121,354 行
  • 数据格式: Snowflake-native JSONL
  • 数据列: ISSUE, TITLE, AUTHOR, TYPE, TEXT, INGESTION_DATE
  • 数据描述: 完整的前1930年《金融世界》档案,这是一份20世纪初的金融报纸,揭露投资欺诈、股票操纵和市场投机。包含干净、结构化的文本,记录了现代美国金融的崛起。

数据内容详情

主要内容涵盖

  • 欺诈性投资计划和股票推广的曝光
  • 德克萨斯石油繁荣、博蒙特、斯宾德尔托普、J.P.摩根与洛克菲勒
  • 采矿欺诈 - 雷山、科罗拉多州推广者
  • 铁路金融和工业整合
  • 早期消费者保护新闻业

适用场景

  • 金融历史和新闻业的LLM微调
  • 欺诈检测AI训练(历史模式)
  • 经济史和市场研究
  • 调查性新闻和媒体研究

数据结构与质量

  • 数据表: FW_CORPUS
  • 数据列说明:
    • ISSUE: Varchar 类型
    • TITLE: Varchar 类型
    • AUTHOR: Varchar 类型
    • TYPE: Varchar 类型
    • TEXT: Varchar 类型
    • INGESTION_DATE: Timestamp_NTZ 类型
  • 数据质量: 经过完全清洗、偏见审计,可直接用于AI训练。

商业需求应用

机器学习

在121,000多行经过整理的20世纪初金融文本上训练、微调和部署机器学习模型。适用于欺诈检测模式识别、金融术语提取和历史市场分析。

真实世界数据

利用历史记录的投资计划、股票操纵和市场泡沫作为研究和分析的真实世界数据。该档案记录了早期美国金融的阴暗面。

生命科学商业化

通过记录投资欺诈、市场监管和消费者保护演变过程的整理历史新闻,支持金融研究。

使用示例

搜索欺诈警告

sql SELECT ISSUE, TITLE FROM FW_CORPUS WHERE TYPE = article AND TEXT ILIKE %fraud% OR TEXT ILIKE %swindler% OR TEXT ILIKE %promoter% LIMIT 10;

按类型统计行数

sql SELECT TYPE, COUNT(*) FROM FW_CORPUS GROUP BY TYPE;

搜索德克萨斯石油繁荣

sql SELECT TITLE, ISSUE FROM FW_CORPUS WHERE TYPE = article AND TEXT ILIKE %texas% OR TEXT ILIKE %oil% OR TEXT ILIKE %beaumont% LIMIT 10;

试用与定价

  • 试用: 提供7天限时试用,可完整访问1902–1930年所有121,354行数据。
  • 定价: 获取完整访问权限需联系提供商获取许可证。

数据维护与覆盖

  • 更新频率: 每年
  • 地理覆盖范围: 美国
  • 云区域可用性 (AWS): 加拿大(中部)、美国东部(弗吉尼亚北部)、美国东部(俄亥俄)、美国西部(俄勒冈)等。

提供商信息

  • 提供商: Devin Media Corp.
  • 专业领域: 为AI训练提供优质历史数据,提供全面、来源可追溯、经过偏见审计、1930年以前的出版物和档案,经过专业清洗和结构化处理,适用于机器学习应用。
  • 数据集特点: 1930年以前,经验证的公共领域/无版权;经过专业OCR和深度清洗;来源可追溯且经过偏见审计;格式为JSONL,适合AI使用;通过安全API交付(无文件下载)。
  • 联系方式:
    • 销售: hello@devinmediacorp.com
    • 支持: hello@devinmediacorp.com
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作