argilla/medical-domain
收藏Hugging Face2022-12-07 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/argilla/medical-domain
下载链接
链接失效反馈官方服务:
资源简介:
医疗转录数据集,包含从mtsamples.com网站上抓取的各种医学专业的样本转录。由于HIPAA隐私法规的限制,医疗数据通常难以获取,因此该数据集提供了一个解决方案。数据集的语言为英语,特性包括文本、输入、预测、预测代理、注释、注释代理、多标签、解释、ID、元数据、状态、事件时间戳和度量等。数据集的大小类别为10K<n<100K,任务类别为文本分类。
提供机构:
argilla
原始信息汇总
数据集卡片 "medical-domain"
数据集描述
数据集概述
医疗转录数据从mtsamples.com抓取。由于HIPAA隐私法规,医疗数据极难找到。该数据集提供了一个解决方案,通过提供医疗转录样本。该数据集包含各种医疗专业的样本医疗转录。
语言
英语
引用信息
感谢mtsamples.com提供的医疗转录数据。
贡献
感谢@davidberenstein1957添加此数据集。
数据集信息
特征
- text: 字符串类型
- inputs: 结构体类型,包含字符串类型的text
- prediction: 列表类型,包含字符串类型的label和浮点数类型的score
- prediction_agent: 字符串类型
- annotation: 空类型
- annotation_agent: 空类型
- multi_label: 布尔类型
- explanation: 空类型
- id: 字符串类型
- metadata: 空类型
- status: 字符串类型
- event_timestamp: 时间戳类型
- metrics: 结构体类型,包含整数类型的text_length
分割
- train: 包含4966个样本,30903523字节
大小
- 下载大小: 14846569字节
- 数据集大小: 30903523字节



