five

bancodobrasil/bbrc_brazilian_banking_regulation_corpora

收藏
Hugging Face2024-05-24 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/bancodobrasil/bbrc_brazilian_banking_regulation_corpora
下载链接
链接失效反馈
官方服务:
资源简介:
BBRC数据集是一个包含25个银行监管风险语料库的集合,这些语料库来自巴西银行的不同部门,涉及投资、保险、人力资源、安全、技术、财务、贷款、会计、欺诈、信用卡、支付方式、农业综合企业、风险等多个领域。数据集由专家进行二元标注,标注内容为每个监管文件是否包含可能需要改变银行部门产品、流程、服务和渠道的监管风险。数据集包含来自巴西金融领域26个监管机构的61,650个标注文档,大多数文档长度在半页到三页之间。数据集大小为1.6GB,自2020年起已应用于自然语言处理(NLP)领域。

BBRC数据集是一个包含25个银行监管风险语料库的集合,这些语料库来自巴西银行的不同部门,涉及投资、保险、人力资源、安全、技术、财务、贷款、会计、欺诈、信用卡、支付方式、农业综合企业、风险等多个领域。数据集由专家进行二元标注,标注内容为每个监管文件是否包含可能需要改变银行部门产品、流程、服务和渠道的监管风险。数据集包含来自巴西金融领域26个监管机构的61,650个标注文档,大多数文档长度在半页到三页之间。数据集大小为1.6GB,自2020年起已应用于自然语言处理(NLP)领域。
提供机构:
bancodobrasil
原始信息汇总

数据集概述

数据集名称

BBRC (Brazilian Banking Regulation Corpora)

数据集内容

  • 描述: BBRC包含25个来自巴西银行不同部门的银行监管风险语料库,涵盖投资、保险、人力资源、安全、技术、财务、贷款、会计、欺诈、信用卡、支付方式、农业综合企业、风险等多个领域。
  • 文档数量: 总共61,650个已标注文档。
  • 文档长度: 大部分文档长度为半页至三页。
  • 语言: 葡萄牙语(pt)
  • 标注方式: 由专家进行二元标注,指示每个监管文档是否包含可能需要改变银行部门产品、流程、服务和渠道的监管风险。
  • 数据集大小: 1.6GB

数据集用途

该数据集用于自然语言处理(NLP)应用,自2020年起已在生产环境中使用。

相关文献

数据集详细描述见论文《BBRC: Brazilian Banking Regulation Corpora》,该论文在2024年的第7届金融技术与自然语言处理(FinNLP)会议上发表。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作