five

yangezheng/tum-nlp-sexism-socialmedia-balanced

收藏
Hugging Face2023-12-08 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/yangezheng/tum-nlp-sexism-socialmedia-balanced
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含文本和标签两个特征,标签用于区分文本是否具有性别歧视。数据集分为训练集、验证集和测试集,分别包含16287、1810和2011个样本。数据集的下载大小为1861869字节,总大小为2753478.0字节。

该数据集包含文本和标签两个特征,标签用于区分文本是否具有性别歧视。数据集分为训练集、验证集和测试集,分别包含16287、1810和2011个样本。数据集的下载大小为1861869字节,总大小为2753478.0字节。
提供机构:
yangezheng
原始信息汇总

数据集概述

特征信息

  • text: 数据类型为字符串。
  • label_sexist: 数据类型为类别标签,包含两个类别:
    • 0: not sexist
    • 1: sexist

数据分割

  • train: 包含16287个样本,大小为2230251.4514621045字节。
  • validation: 包含1810个样本,大小为247851.36164710563字节。
  • test: 包含2011个样本,大小为275375.1868907897字节。

数据集大小

  • 下载大小: 1861869字节
  • 数据集大小: 2753478.0字节

配置信息

  • config_name: default
  • data_files:
    • train: 路径为data/train-*
    • validation: 路径为data/validation-*
    • test: 路径为data/test-*
二维码
社区交流群
二维码
科研交流群
商业服务