MinutasBanRepCol
收藏Minutas Banco de la República Colombia 数据集
基本信息
- 许可证: odc-by
- 语言: 西班牙语
- 标签: 经济学
- 大小类别: n<1K
- 任务类别: 文本分类
- 格式: CSV, Parquet
描述
该数据集旨在整合哥伦比亚中央银行(Banco de la República)的货币政策会议纪要,并使其易于用于研究。会议纪要描述了哥伦比亚中央银行董事会成员在利率政策决策中所考虑的因素以及决策本身。这些关于中央银行会议纪要的语料库在经济学文献中被广泛使用,用于构建情感指标,以及从基于文本的非结构化数据中提取货币政策指标和经济变量。通常,现有的语料库以英语为主,但据我们所知,这是首个以西班牙语提供的货币政策语料库。
数据集中的会议纪要从2007年6月开始,当时哥伦比亚中央银行董事会决定开始发布这些纪要。
动机
经济学文献最近开始使用中央银行的公告作为丰富的数据来源进行分析。然而,截至目前,没有公开可访问的、以西班牙语为官方语言的中央银行数据源。通过这个数据集,我们希望开始这一路径,增加西班牙语高质量公共数据库的数量。
结构
该数据集为表格格式(185 x 2)。每条记录包含以下属性:
- fecha: 会议纪要的发布日期(YYYY-MM-DD)。日期中的日部分不准确,因此所有日期都以当月的第一天作为日。
- text: 从原始PDF中提取的会议纪要文本。
数据来源
原始的PDF格式会议纪要文件可以在哥伦比亚中央银行的官方页面找到。感谢Fredy Muñoz在整合会议纪要数据集方面的合作。
数据处理
会议纪要文本是从PDF中使用PyMuPDF提取的。为了保留尽可能多的信息,没有应用任何文本预处理步骤,相关步骤由用户自行决定。
使用和引用政策
该语料库可以自由用于非商业目的,只需注明作者: bash @misc{Muvdi2024BanRep title={Minutas Política Monetaria Banco de la República Colombia}, author={Muvdi Yabra and Javier Gómez}, year={2024}, url = {https://huggingface.co/datasets/yabramuvdi/MinutasBanRepCol/} }




