mediabiasgroup/anno-lexical-coreset
收藏Hugging Face2025-02-04 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/mediabiasgroup/anno-lexical-coreset
下载链接
链接失效反馈官方服务:
资源简介:
这是一个文本分类数据集,包含文本内容、标签、来源名称和句子ID等字段。数据集分为训练集和测试集,适用于英语文本的分类任务,特别关注媒体偏见、偏见和词汇偏见。数据集大小在1K到10K条记录之间。
This is a text classification dataset containing fields such as text content, label, source name, and sentence ID. The dataset is split into training and test sets, suitable for English text classification tasks, particularly focusing on media bias, bias, and lexical bias. The dataset size is between 1K and 10K records.
提供机构:
mediabiasgroup
原始信息汇总
数据集概述
数据集特征
- text: 文本数据,数据类型为字符串。
- source_party: 数据来源方,数据类型为字符串。
- source_name: 数据来源名称,数据类型为字符串。
- label: 标签,数据类型为整数(int64)。
- sentence_id: 句子ID,数据类型为字符串。
- index_level_0: 索引级别0,数据类型为整数(int64)。
数据集分割
- train: 训练集,包含3121个样本,占用716139字节。
- test: 测试集,包含1000个样本,占用232170字节。
数据集大小
- 下载大小: 642762字节
- 数据集总大小: 948309字节
配置信息
- config_name: default
- data_files:
- train: 路径为
data/train-* - test: 路径为
data/test-*
- train: 路径为
- data_files:



