HebArabNlpProject/HebrewSentiment
收藏Hugging Face2026-04-18 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/HebArabNlpProject/HebrewSentiment
下载链接
链接失效反馈官方服务:
资源简介:
HebrewSentiment是一个用于情感分析任务的希伯来语数据集。数据集包含训练集和测试集,分别有39,135和2,170个样本。每个样本包含id、text、tag_ids等字段。数据集还提供了与DICTA合作训练的模型DictaBERT-Sentiment,并与其他数据集进行了性能比较。
HebrewSentiment是一个用于情感分析任务的希伯来语数据集。数据集包含训练集和测试集,分别有39,135和2,170个样本。每个样本包含id、text、tag_ids等字段。数据集还提供了与DICTA合作训练的模型DictaBERT-Sentiment,并与其他数据集进行了性能比较。
提供机构:
HebArabNlpProject
原始信息汇总
数据集概述
数据集名称
- HebrewSentiment
数据集用途
- 情感分析任务
数据集语言
- 希伯来语(he)
数据集大小
- 10K<n<100K
数据集文件配置
- 训练数据:路径为
train/data.jsonl - 测试数据:路径为
test/test.jsonl
数据集统计
- 训练集:总计39,135条,其中正面8,968条,负面7,669条,中性22,498条
- 测试集:总计2,170条,其中正面503条,负面433条,中性1,234条
数据集字段描述
- id:唯一标识符
- text:输入句子的文本内容
- tag_ids:示例标签(中性/正面/负面)
模型与比较
-
训练模型:与DICTA合作训练的模型DictaBERT-Sentiment
-
性能比较:与Hebrew-Sentiment-Data from OnlpLab比较,结果如下:
训练语料库 准确率 宏观F1 正面F1 负面F1 中性F1 OnlpLab+HebrewSentiment 87 61.7 93.2 74.6 17.4 OnlpLab 88.2 63.3 93.8 72.1 24 HebrewSentiment 69.9 51.7 82.2 62.9 10.2
许可证
- CC-BY-4.0



