five

allganize/en-fpb-ko

收藏
Hugging Face2024-04-02 更新2024-06-15 收录
下载链接:
https://hf-mirror.com/datasets/allganize/en-fpb-ko
下载链接
链接失效反馈
官方服务:
资源简介:
en-fpb-ko数据集是一个用于情感分析的金融新闻句子分类数据集,将句子分为긍정, 중립, 부정三类。该数据集是通过将ChanceFocus/en-fpb的测试集翻译成韩语并清理误译数据后生成的,最终包含944个评估数据。

The en-fpb-ko dataset is a financial news sentence classification dataset for sentiment analysis, which classifies sentences into three categories: positive (긍정), neutral (중립), and negative (부정). This dataset is constructed by translating the test set of the ChanceFocus/en-fpb dataset into Korean and correcting mistranslated data, and ultimately contains 944 evaluation samples.
提供机构:
allganize
原始信息汇总

数据集概述

数据集信息

  • 名称: en-fpb-ko
  • 描述: 该数据集用于情感分类,从金融新闻中提取句子并分类为“正面”、“中性”或“负面”。
  • 语言: 韩语
  • 许可: MIT

数据结构

  • 特征:
    • conversation_id: 字符串类型
    • conversations: 列表类型,包含以下子特征:
      • from: 字符串类型
      • value: 字符串类型

数据分割

  • 测试集:
    • 文件名: data/test-*
    • 字节数: 333061
    • 样本数: 944

数据来源

数据示例

json { "conversation_id": "fpb3876", "conversations": [ { "from": "human", "value": "금융 뉴스 기사에서 발췌한 이 문장의 정서를 분석하세요. 부정, 긍정 또는 중립 중 하나로 답을 제시하세요. 텍스트: 회사 간의 오랜 협력 관계를 확대하는 새로운 계약에는 Larox에서 Etteplan으로 특정 엔지니어링 및 문서 기능의 이전이 포함됩니다. 정답:" }, { "from": "gpt", "value": "긍정" } ] }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作