five

ccerpas/sentiment-banking

收藏
Hugging Face2023-06-28 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ccerpas/sentiment-banking
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: text dtype: string - name: inputs struct: - name: text dtype: string - name: prediction list: - name: label dtype: string - name: score dtype: float64 - name: prediction_agent dtype: string - name: annotation dtype: 'null' - name: annotation_agent dtype: 'null' - name: multi_label dtype: bool - name: explanation dtype: 'null' - name: id dtype: 'null' - name: metadata struct: - name: category dtype: int64 - name: status dtype: string - name: event_timestamp dtype: 'null' - name: metrics dtype: 'null' splits: - name: train num_bytes: 1205760 num_examples: 5001 download_size: 447816 dataset_size: 1205760 --- # Dataset Card for "sentiment-banking" [More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)

dataset_info: features: - name: 文本(text) dtype: 字符串(string) - name: 输入项(inputs) struct: - name: 文本(text) dtype: 字符串(string) - name: 预测结果(prediction) list: - name: 标签(label) dtype: 字符串(string) - name: 置信度得分(score) dtype: 64位浮点数(float64) - name: 预测智能体(prediction_agent) dtype: 字符串(string) - name: 标注信息(annotation) dtype: 空值(null) - name: 标注智能体(annotation_agent) dtype: 空值(null) - name: 多标签标识(multi_label) dtype: 布尔型(bool) - name: 解释说明(explanation) dtype: 空值(null) - name: 标识符(id) dtype: 空值(null) - name: 元数据(metadata) struct: - name: 类别(category) dtype: 64位整型(int64) - name: 状态(status) dtype: 字符串(string) - name: 事件时间戳(event_timestamp) dtype: 空值(null) - name: 评估指标(metrics) dtype: 空值(null) splits: - name: 训练集(train) num_bytes: 1205760 num_examples: 5001 download_size: 447816 dataset_size: 1205760 --- # "sentiment-banking"数据集卡片 [需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
ccerpas
原始信息汇总

数据集概述

数据集特征

  • text:文本类型,数据类型为字符串。
  • inputs:结构化数据,包含子特征 text,数据类型为字符串。
  • prediction:列表类型,包含两个子特征:
    • label:数据类型为字符串。
    • score:数据类型为浮点数(float64)。
  • prediction_agent:数据类型为字符串。
  • annotation:数据类型为空(null)。
  • annotation_agent:数据类型为空(null)。
  • multi_label:数据类型为布尔值。
  • explanation:数据类型为空(null)。
  • id:数据类型为空(null)。
  • metadata:结构化数据,包含子特征 category,数据类型为整数(int64)。
  • status:数据类型为字符串。
  • event_timestamp:数据类型为空(null)。
  • metrics:数据类型为空(null)。

数据集分割

  • train:训练集,包含5001个样本,总大小为1205760字节。

数据集大小

  • 下载大小:447816字节。
  • 数据集大小:1205760字节。
搜集汇总
数据集介绍
main_image_url
构建方式
在金融情感分析领域,sentiment-banking数据集通过结构化数据采集与标注流程构建而成。该数据集包含文本内容、输入结构、预测标签及分数、预测代理等特征字段,并采用多标签分类框架。数据来源于银行业相关文本,经过预处理后划分为训练集,共收录5001条样本,总数据量约1.2MB,确保了数据在金融语境下的代表性与一致性。
特点
该数据集以银行业文本为核心,具备多维度特征:文本字段存储原始内容,输入结构支持复杂分析,预测部分涵盖标签与置信度评分,并标注预测代理来源。其多标签分类设计允许同时识别多种情感倾向,而元数据中的类别字段增强了数据的可解释性。数据状态与时间戳字段虽部分为空,但整体结构清晰,适用于精细化情感挖掘任务。
使用方法
使用该数据集时,可直接通过HuggingFace平台加载,利用其训练集进行模型训练或评估。用户可基于文本字段提取语义特征,结合预测标签与分数监督学习过程,多标签字段支持复杂分类场景。数据中的元数据类别可用于领域细分分析,而结构化输入便于集成至自然语言处理流程,适用于情感分析、风险监测等金融应用场景。
背景与挑战
背景概述
在金融科技与自然语言处理交叉领域,情感分析技术对于理解客户反馈、监测市场情绪具有关键价值。数据集'sentiment-banking'由ccerpas于近期构建,旨在针对银行业务场景中的文本数据进行情感倾向性标注。该数据集聚焦于解决金融文本中情感细粒度识别的研究问题,通过结构化特征如文本内容、预测标签与置信度等,为模型训练与评估提供资源。其创建反映了学术界与业界对领域自适应情感分析日益增长的需求,推动了金融自然语言处理向更精准、可解释的方向发展。
当前挑战
该数据集面临的挑战主要体现在两个方面:在领域问题层面,银行业文本常包含专业术语、模糊表达与多义性,使得传统情感分类模型难以准确捕捉上下文中的情感细微差异,例如客户投诉中的隐含负面情绪或金融新闻中的中性偏倚。在构建过程中,数据收集需处理敏感金融信息的匿名化与合规性约束,同时标注工作面临主观性干扰,缺乏统一的情感标签标准可能导致标注不一致,影响数据集的可靠性与泛化能力。
常用场景
经典使用场景
在金融情感分析领域,sentiment-banking数据集为研究者提供了一个专注于银行服务文本情感倾向的基准资源。该数据集通过标注用户对银行服务的评论或反馈,捕捉了积极、消极或中立的情感极性,常用于训练和评估情感分类模型。其经典使用场景包括构建监督学习框架,利用文本特征提取技术如词嵌入或预训练语言模型,来预测金融语境下的情感分布,从而深化对客户情绪的理解。
衍生相关工作
基于该数据集,衍生了一系列经典研究工作,包括开发针对金融情感的多标签分类算法、集成迁移学习策略以提升模型在跨领域情感任务中的性能,以及探索情感解释性方法以增强模型透明度。这些工作推动了金融自然语言处理技术的进步,并为后续更广泛的领域适应研究奠定了基础。
数据集最近研究
最新研究方向
在金融情感分析领域,sentiment-banking数据集作为专注于银行业务文本情感标注的资源,正推动前沿研究向细粒度情感识别与多模态融合方向深化。当前热点聚焦于利用预训练语言模型结合领域自适应技术,提升对金融术语和语境敏感性的捕捉能力,以应对市场波动事件中的情感极性动态变化。该数据集的应用不仅助力风险预警系统的构建,还为个性化金融服务的情感智能交互提供数据支撑,在金融科技智能化进程中具有关键意义。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作