mediabiasgroup/anno-lexical-coreset

Name: mediabiasgroup/anno-lexical-coreset
Creator: mediabiasgroup
Published: 2025-02-04 02:20:01
License: 暂无描述

Hugging Face2025-02-04 更新2024-06-29 收录

下载链接：

https://hf-mirror.com/datasets/mediabiasgroup/anno-lexical-coreset

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个文本分类数据集，包含文本内容、标签、来源名称和句子ID等字段。数据集分为训练集和测试集，适用于英语文本的分类任务，特别关注媒体偏见、偏见和词汇偏见。数据集大小在1K到10K条记录之间。

This is a text classification dataset containing fields such as text content, label, source name, and sentence ID. The dataset is split into training and test sets, suitable for English text classification tasks, particularly focusing on media bias, bias, and lexical bias. The dataset size is between 1K and 10K records.

提供机构：

mediabiasgroup

原始信息汇总

数据集概述

数据集特征

text: 文本数据，数据类型为字符串。
source_party: 数据来源方，数据类型为字符串。
source_name: 数据来源名称，数据类型为字符串。
label: 标签，数据类型为整数（int64）。
sentence_id: 句子ID，数据类型为字符串。
index_level_0: 索引级别0，数据类型为整数（int64）。

数据集分割

train: 训练集，包含3121个样本，占用716139字节。
test: 测试集，包含1000个样本，占用232170字节。

数据集大小

下载大小: 642762字节
数据集总大小: 948309字节

配置信息

config_name: default
- data_files:
  - train: 路径为data/train-*
  - test: 路径为data/test-*

5,000+

优质数据集

54 个

任务类型

进入经典数据集