Lines/Open-Domain-Oral-Disease-QA-Dataset
收藏Hugging Face2024-04-28 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Lines/Open-Domain-Oral-Disease-QA-Dataset
下载链接
链接失效反馈官方服务:
资源简介:
该数据集精心设计用于评估大型语言模型(LLMs)在口腔疾病领域的诊断能力。数据集采用JSON Lines格式,每行包含一个完整的对话上下文,包括手动评估结果和机器学习模型训练所需的元信息。数据集由Yuanhao Zeng策划,语言为英语,遵循MIT许可证。数据来源包括福建医科大学的志愿者,并参考了NIH、Mayo Clinic等官方资料。
该数据集精心设计用于评估大型语言模型(LLMs)在口腔疾病领域的诊断能力。数据集采用JSON Lines格式,每行包含一个完整的对话上下文,包括手动评估结果和机器学习模型训练所需的元信息。数据集由Yuanhao Zeng策划,语言为英语,遵循MIT许可证。数据来源包括福建医科大学的志愿者,并参考了NIH、Mayo Clinic等官方资料。
提供机构:
Lines
原始信息汇总
Open-Domain-Oral-Disease-QA-Dataset 概述
数据集描述
数据集详情
- 目的: 本数据集旨在评估大型语言模型(LLMs)在口腔疾病诊断领域的能力。
- 包含模型: 目前提供的数据集包括GPT-3.5、GPT-4、Palm2和Llama2-70B等模型的评估数据。
- 数据格式: 数据集采用JSON Lines(jsonl)格式,每行包含一个全面的对话上下文,包括手动评估结果和机器学习模型训练所需的元信息。
- 数据来源: 数据集由福建医科大学的志愿者收集,涵盖了多种常见口腔疾病,如牙髓炎、颞下颌关节紊乱、牙周病等,并通过两位牙科全科医生的总结,参考NIH、Mayo Clinic和Cleveland Clinic等官方网站的主要症状,编译成统一格式的问题,用于查询不同的LLMs。
数据集结构
- 格式: JSON Lines(jsonl)
- 内容: 每行包含一个对话上下文,包括手动评估结果和元信息。
数据集创建
- 采集与处理: 数据集收集了常见的口腔疾病及其主要症状,由牙科医生总结并参考官方医疗机构的信息。
- 数据生产者: 福建医科大学的志愿者。
许可证
- 许可证: MIT
语言
- 语言: 英语
联系方式
- 联系人: Yuanhao Zeng
- 邮箱: cengyuanhao@bupt.edu.cn
使用场景
- 直接用途: 用于评估大型语言模型在口腔疾病诊断领域的能力。
引用信息
-
BibTeX:
@misc{zhuang2024opendomainoral, title={Open-Domain Oral Disease QA Dataset}, author={Zhuang, Shiyang and Zeng, Yuanhao}, year={2024}, howpublished={Dataset}, note={Accessed from Yuanhao Zeng at cengyuanhao@bupt.edu.cn} }
-
APA:
Zhuang, S., & Zeng, Y. (2024). Open-Domain Oral Disease QA Dataset [Dataset]. Retrieved from Yuanhao Zeng at cengyuanhao@bupt.edu.cn
搜集汇总
数据集介绍

以上内容由遇见数据集搜集并总结生成



