yangezheng/tum-nlp-sexism-socialmedia-balanced
收藏Hugging Face2023-12-08 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/yangezheng/tum-nlp-sexism-socialmedia-balanced
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含文本和标签两个特征,标签用于区分文本是否具有性别歧视。数据集分为训练集、验证集和测试集,分别包含16287、1810和2011个样本。数据集的下载大小为1861869字节,总大小为2753478.0字节。
该数据集包含文本和标签两个特征,标签用于区分文本是否具有性别歧视。数据集分为训练集、验证集和测试集,分别包含16287、1810和2011个样本。数据集的下载大小为1861869字节,总大小为2753478.0字节。
提供机构:
yangezheng
原始信息汇总
数据集概述
特征信息
- text: 数据类型为字符串。
- label_sexist: 数据类型为类别标签,包含两个类别:
- 0: not sexist
- 1: sexist
数据分割
- train: 包含16287个样本,大小为2230251.4514621045字节。
- validation: 包含1810个样本,大小为247851.36164710563字节。
- test: 包含2011个样本,大小为275375.1868907897字节。
数据集大小
- 下载大小: 1861869字节
- 数据集大小: 2753478.0字节
配置信息
- config_name: default
- data_files:
- train: 路径为
data/train-* - validation: 路径为
data/validation-* - test: 路径为
data/test-*
- train: 路径为



