eber/autotrain-data-disparities_pubmed_mit
收藏Hugging Face2022-12-10 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/eber/autotrain-data-disparities_pubmed_mit
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是为项目disparities_pubmed_mit自动处理的AutoTrain数据集,主要用于文本分类任务。数据集的语言为英语,包含两个字段:text(文本内容)和target(二分类标签)。数据集被划分为训练集和验证集,分别包含807和203个样本。
提供机构:
eber
原始信息汇总
数据集概述
数据集名称
AutoTrain Dataset for project: disparities_pubmed_mit
语言
数据集语言为英语,BCP-47代码为en。
数据集结构
数据实例
数据集中的样本包含以下字段:
text: 文本内容,类型为字符串。target: 目标分类,类型为整数,类别为0和1。
数据集字段
数据集包含两个主要字段:
text: 文本字段,数据类型为字符串。target: 分类标签,包含两个类别0和1。
数据集分割
数据集被分割为训练集和验证集,具体分割如下:
| 分割名称 | 样本数量 |
|---|---|
| 训练集 | 807 |
| 验证集 | 203 |
任务类别
数据集属于文本分类任务。



