allganize/en-fpb-ko
收藏Hugging Face2024-04-02 更新2024-06-15 收录
下载链接:
https://hf-mirror.com/datasets/allganize/en-fpb-ko
下载链接
链接失效反馈官方服务:
资源简介:
en-fpb-ko数据集是一个用于情感分析的金融新闻句子分类数据集,将句子分为긍정, 중립, 부정三类。该数据集是通过将ChanceFocus/en-fpb的测试集翻译成韩语并清理误译数据后生成的,最终包含944个评估数据。
The en-fpb-ko dataset is a financial news sentence classification dataset for sentiment analysis, which classifies sentences into three categories: positive (긍정), neutral (중립), and negative (부정). This dataset is constructed by translating the test set of the ChanceFocus/en-fpb dataset into Korean and correcting mistranslated data, and ultimately contains 944 evaluation samples.
提供机构:
allganize
原始信息汇总
数据集概述
数据集信息
- 名称: en-fpb-ko
- 描述: 该数据集用于情感分类,从金融新闻中提取句子并分类为“正面”、“中性”或“负面”。
- 语言: 韩语
- 许可: MIT
数据结构
- 特征:
conversation_id: 字符串类型conversations: 列表类型,包含以下子特征:from: 字符串类型value: 字符串类型
数据分割
- 测试集:
- 文件名: data/test-*
- 字节数: 333061
- 样本数: 944
数据来源
- 原始数据集: ChanceFocus/en-fpb
数据示例
json { "conversation_id": "fpb3876", "conversations": [ { "from": "human", "value": "금융 뉴스 기사에서 발췌한 이 문장의 정서를 분석하세요. 부정, 긍정 또는 중립 중 하나로 답을 제시하세요. 텍스트: 회사 간의 오랜 협력 관계를 확대하는 새로운 계약에는 Larox에서 Etteplan으로 특정 엔지니어링 및 문서 기능의 이전이 포함됩니다. 정답:" }, { "from": "gpt", "value": "긍정" } ] }



