Wiebke/SemEvalTask10_train_all_tasks
收藏Hugging Face2023-02-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Wiebke/SemEvalTask10_train_all_tasks
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: rewire_id
dtype: string
- name: text
dtype: string
- name: label
dtype:
class_label:
names:
'0': not sexist
'1': sexist
- name: label_category
dtype: string
- name: label_vector
dtype: string
splits:
- name: train
num_bytes: 2470446.0
num_examples: 12600
- name: test
num_bytes: 274494.0
num_examples: 1400
download_size: 1475013
dataset_size: 2744940.0
---
# Dataset Card for "SemEvalTask10_train_all_tasks"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
---
数据集信息:
特征项:
- 字段名:rewire_id,数据类型:字符串(string)
- 字段名:text,数据类型:字符串(string)
- 字段名:label,数据类型:类别标签(class_label),其类别映射为:
'0': 非性别歧视(not sexist)
'1': 性别歧视(sexist)
- 字段名:label_category,数据类型:字符串(string)
- 字段名:label_vector,数据类型:字符串(string)
数据集划分:
- 划分名称:训练集(train),占用字节数:2470446.0,样本数量:12600
- 划分名称:测试集(test),占用字节数:274494.0,样本数量:1400
下载大小:1475013
数据集总大小:2744940.0
---
# "SemEvalTask10_train_all_tasks" 数据集卡片
[需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
Wiebke
原始信息汇总
数据集概述
数据集名称
- 名称: SemEvalTask10_train_all_tasks
数据集特征
- 特征列表:
- rewire_id: 数据类型为字符串。
- text: 数据类型为字符串。
- label: 数据类型为分类标签,包含两个类别:
- 0: not sexist
- 1: sexist
- label_category: 数据类型为字符串。
- label_vector: 数据类型为字符串。
数据集划分
- 训练集:
- 样本数量: 12600
- 数据大小: 2470446.0 字节
- 测试集:
- 样本数量: 1400
- 数据大小: 274494.0 字节
数据集大小
- 下载大小: 1475013 字节
- 总数据大小: 2744940.0 字节



