five

Lines/Open-Domain-Oral-Disease-QA-Dataset

收藏
Hugging Face2024-04-28 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Lines/Open-Domain-Oral-Disease-QA-Dataset
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集精心设计用于评估大型语言模型(LLMs)在口腔疾病领域的诊断能力。数据集采用JSON Lines格式,每行包含一个完整的对话上下文,包括手动评估结果和机器学习模型训练所需的元信息。数据集由Yuanhao Zeng策划,语言为英语,遵循MIT许可证。数据来源包括福建医科大学的志愿者,并参考了NIH、Mayo Clinic等官方资料。

该数据集精心设计用于评估大型语言模型(LLMs)在口腔疾病领域的诊断能力。数据集采用JSON Lines格式,每行包含一个完整的对话上下文,包括手动评估结果和机器学习模型训练所需的元信息。数据集由Yuanhao Zeng策划,语言为英语,遵循MIT许可证。数据来源包括福建医科大学的志愿者,并参考了NIH、Mayo Clinic等官方资料。
提供机构:
Lines
原始信息汇总

Open-Domain-Oral-Disease-QA-Dataset 概述

数据集描述

数据集详情

  • 目的: 本数据集旨在评估大型语言模型(LLMs)在口腔疾病诊断领域的能力。
  • 包含模型: 目前提供的数据集包括GPT-3.5、GPT-4、Palm2和Llama2-70B等模型的评估数据。
  • 数据格式: 数据集采用JSON Lines(jsonl)格式,每行包含一个全面的对话上下文,包括手动评估结果和机器学习模型训练所需的元信息。
  • 数据来源: 数据集由福建医科大学的志愿者收集,涵盖了多种常见口腔疾病,如牙髓炎、颞下颌关节紊乱、牙周病等,并通过两位牙科全科医生的总结,参考NIH、Mayo Clinic和Cleveland Clinic等官方网站的主要症状,编译成统一格式的问题,用于查询不同的LLMs。

数据集结构

  • 格式: JSON Lines(jsonl)
  • 内容: 每行包含一个对话上下文,包括手动评估结果和元信息。

数据集创建

  • 采集与处理: 数据集收集了常见的口腔疾病及其主要症状,由牙科医生总结并参考官方医疗机构的信息。
  • 数据生产者: 福建医科大学的志愿者。

许可证

  • 许可证: MIT

语言

  • 语言: 英语

联系方式

  • 联系人: Yuanhao Zeng
  • 邮箱: cengyuanhao@bupt.edu.cn

使用场景

  • 直接用途: 用于评估大型语言模型在口腔疾病诊断领域的能力。

引用信息

  • BibTeX:

    @misc{zhuang2024opendomainoral, title={Open-Domain Oral Disease QA Dataset}, author={Zhuang, Shiyang and Zeng, Yuanhao}, year={2024}, howpublished={Dataset}, note={Accessed from Yuanhao Zeng at cengyuanhao@bupt.edu.cn} }

  • APA:

    Zhuang, S., & Zeng, Y. (2024). Open-Domain Oral Disease QA Dataset [Dataset]. Retrieved from Yuanhao Zeng at cengyuanhao@bupt.edu.cn

搜集汇总
数据集介绍
main_image_url
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作