bancodobrasil/bbrc_brazilian_banking_regulation_corpora
收藏Hugging Face2024-05-24 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/bancodobrasil/bbrc_brazilian_banking_regulation_corpora
下载链接
链接失效反馈官方服务:
资源简介:
BBRC数据集是一个包含25个银行监管风险语料库的集合,这些语料库来自巴西银行的不同部门,涉及投资、保险、人力资源、安全、技术、财务、贷款、会计、欺诈、信用卡、支付方式、农业综合企业、风险等多个领域。数据集由专家进行二元标注,标注内容为每个监管文件是否包含可能需要改变银行部门产品、流程、服务和渠道的监管风险。数据集包含来自巴西金融领域26个监管机构的61,650个标注文档,大多数文档长度在半页到三页之间。数据集大小为1.6GB,自2020年起已应用于自然语言处理(NLP)领域。
BBRC数据集是一个包含25个银行监管风险语料库的集合,这些语料库来自巴西银行的不同部门,涉及投资、保险、人力资源、安全、技术、财务、贷款、会计、欺诈、信用卡、支付方式、农业综合企业、风险等多个领域。数据集由专家进行二元标注,标注内容为每个监管文件是否包含可能需要改变银行部门产品、流程、服务和渠道的监管风险。数据集包含来自巴西金融领域26个监管机构的61,650个标注文档,大多数文档长度在半页到三页之间。数据集大小为1.6GB,自2020年起已应用于自然语言处理(NLP)领域。
提供机构:
bancodobrasil
原始信息汇总
数据集概述
数据集名称
BBRC (Brazilian Banking Regulation Corpora)
数据集内容
- 描述: BBRC包含25个来自巴西银行不同部门的银行监管风险语料库,涵盖投资、保险、人力资源、安全、技术、财务、贷款、会计、欺诈、信用卡、支付方式、农业综合企业、风险等多个领域。
- 文档数量: 总共61,650个已标注文档。
- 文档长度: 大部分文档长度为半页至三页。
- 语言: 葡萄牙语(pt)
- 标注方式: 由专家进行二元标注,指示每个监管文档是否包含可能需要改变银行部门产品、流程、服务和渠道的监管风险。
- 数据集大小: 1.6GB
数据集用途
该数据集用于自然语言处理(NLP)应用,自2020年起已在生产环境中使用。
相关文献
数据集详细描述见论文《BBRC: Brazilian Banking Regulation Corpora》,该论文在2024年的第7届金融技术与自然语言处理(FinNLP)会议上发表。



