HoangHa/medical-domain
收藏Hugging Face2024-01-11 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/HoangHa/medical-domain
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: text
dtype: string
- name: inputs
struct:
- name: text
dtype: string
- name: prediction
list:
- name: label
dtype: string
- name: score
dtype: float64
- name: prediction_agent
dtype: string
- name: annotation
dtype: 'null'
- name: annotation_agent
dtype: 'null'
- name: multi_label
dtype: bool
- name: explanation
dtype: 'null'
- name: id
dtype: string
- name: metadata
dtype: 'null'
- name: status
dtype: string
- name: event_timestamp
dtype: timestamp[us]
- name: metrics
struct:
- name: text_length
dtype: int64
splits:
- name: train
num_bytes: 30903523
num_examples: 4966
download_size: 14848504
dataset_size: 30903523
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
dataset_info:
特征:
- 名称: 文本
数据类型: 字符串
- 名称: 输入
结构体:
- 名称: 文本
数据类型: 字符串
- 名称: 预测
列表:
- 名称: 标签
数据类型: 字符串
- 名称: 得分
数据类型: float64
- 名称: 预测智能体
数据类型: 字符串
- 名称: 注释
数据类型: 'null'
- 名称: 注释智能体
数据类型: 'null'
- 名称: 多标签
数据类型: 布尔值
- 名称: 解释
数据类型: 'null'
- 名称: 标识符
数据类型: 字符串
- 名称: 元数据
数据类型: 'null'
- 名称: 状态
数据类型: 字符串
- 名称: 事件时间戳
数据类型: 微秒级时间戳[us]
- 名称: 指标
结构体:
- 名称: 文本长度
数据类型: int64
分割:
- 名称: 训练集
字节数: 30903523
样本数: 4966
下载大小: 14848504
数据集大小: 30903523
配置:
- 配置名称: 默认
数据文件:
- 分割: 训练集
路径: data/train-*
提供机构:
HoangHa
原始信息汇总
数据集信息
特征
- text: 数据类型为
string - inputs: 结构化数据,包含以下字段:
- text: 数据类型为
string
- text: 数据类型为
- prediction: 列表类型,包含以下字段:
- label: 数据类型为
string - score: 数据类型为
float64
- label: 数据类型为
- prediction_agent: 数据类型为
string - annotation: 数据类型为
null - annotation_agent: 数据类型为
null - multi_label: 数据类型为
bool - explanation: 数据类型为
null - id: 数据类型为
string - metadata: 数据类型为
null - status: 数据类型为
string - event_timestamp: 数据类型为
timestamp[us] - metrics: 结构化数据,包含以下字段:
- text_length: 数据类型为
int64
- text_length: 数据类型为
数据分割
- train: 包含 4966 个样本,数据大小为 30903523 字节
数据集大小
- 下载大小: 14848504 字节
- 数据集大小: 30903523 字节
配置
- default: 包含训练数据文件,路径为
data/train-*



