five

ViMedical Disease

收藏
github2024-05-25 更新2024-05-31 收录
下载链接:
https://github.com/PB3002/ViMedical_Disease
下载链接
链接失效反馈
官方服务:
资源简介:
ViMedical Disease是一个包含超过12000个关于常见疾病症状问题的越南语数据集,旨在帮助分类疾病症状和初步识别医疗条件。该数据集包含多种常见疾病的信息,如心血管、胃肠道、神经、皮肤、内分泌等疾病。

The ViMedical Disease dataset comprises over 12,000 Vietnamese language questions related to symptoms of common diseases, designed to assist in classifying disease symptoms and preliminary identification of medical conditions. This dataset includes information on a variety of common diseases such as cardiovascular, gastrointestinal, neurological, dermatological, and endocrine disorders.
创建时间:
2024-05-14
原始信息汇总

数据集概述

名称: ViMedical Disease

创建日期: 2024-04-05

作者: Phuc Nguyen, Dao Thong

内容: 包含超过12,000个关于常见疾病的问答和症状描述,涵盖心血管、胃肠道、神经、皮肤、内分泌等多个领域的疾病。

用途:

  • 疾病症状分类
  • 疾病初步识别
  • 研究目的
  • 开发疾病预测模型
  • 提供用户关于常见疾病症状的信息

数据结构

数据集包含以下两列:

  • Disease: 疾病名称
  • Question: 包含疾病症状描述的问题

问题结构:

  • 开头: "Im having symptoms like/Im feeling/I often/..."
  • 中间: 疾病症状描述
  • 结尾: "What could be wrong with me?"

示例数据

Disease Question
Bệnh Cơ Tim Giãn Nở Tôi đang cảm thấy mệt mỏi, chóng mặt và nhịp tim không đều. Tôi có thể đang bị bệnh gì?
Alzheimer Tôi hay quên mất mình đang làm gì và mục đích của hành động đó. Tôi có thể đang bị bệnh gì?
Viêm Cầu Thận Lupus Tôi đang cảm thấy suy giảm chức năng thận, hội chứng thận hư. Tôi có thể đang bị bệnh gì?

数据集使用

  • 数据分析
  • 构建疾病预测模型
  • 创建聊天机器人
  • 用户支持

版权与许可

许可: 该数据集受 Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) 许可约束。

使用条款:

  • 仅限非商业用途,包括研究、教育和个人使用。
  • 必须明确并显著地引用ViMedical。
  • 不得修改、改编或基于数据集创建衍生作品。
  • 遵守所有适用的法律和法规。
  • 用户对使用数据集产生的任何后果负全部责任。
搜集汇总
数据集介绍
main_image_url
构建方式
ViMedical Disease数据集的构建基于Kalapa Bytebattles 2023竞赛中的越南语医疗问答部分。该数据集从Tam Anh医院收集了超过600篇关于各种疾病的文章,从中提取了603种不同的疾病,并为每种疾病生成了20个关于患者症状的问题。每个问题以“I'm having symptoms like/I'm feeling/I often/...”开头,随后描述疾病的症状,并以“What could be wrong with me?”结尾。这种结构化的构建方式确保了数据集的实用性和一致性。
特点
ViMedical Disease数据集的显著特点在于其丰富的内容和结构化的格式。该数据集包含了超过12,000个关于常见疾病的问题和症状描述,涵盖心血管、消化系统、神经系统、皮肤病、内分泌等多个医学领域。每个问题均以标准化的句式开始,并详细描述疾病的症状,结尾处提出诊断疑问,这种设计有助于模型训练和疾病预测模型的开发。
使用方法
ViMedical Disease数据集适用于多种应用场景,包括数据分析、疾病预测模型的构建、聊天机器人的开发以及用户支持系统的创建。用户可以通过分析数据集中的问题和症状描述,训练机器学习模型以识别和预测疾病。此外,该数据集还可用于开发智能问答系统,为用户提供初步的疾病信息和建议。使用时,用户应遵循非商业用途的许可协议,并在所有使用实例中明确引用数据集的来源。
背景与挑战
背景概述
ViMedical Disease数据集是由Phuc Nguyen和Dao Thong于2024年4月5日创建的越南语数据集,旨在支持疾病症状的分类和初步诊断。该数据集包含了超过12,000个关于常见疾病的问题和症状,涵盖心血管、消化系统、神经系统、皮肤科、内分泌等多个医学领域。其核心研究问题在于通过提供丰富的症状描述,帮助研究人员和开发者构建预测模型,从而提高疾病诊断的准确性和效率。ViMedical Disease数据集不仅在学术研究中具有重要价值,也为开发医疗支持系统和聊天机器人提供了宝贵的资源。
当前挑战
ViMedical Disease数据集在构建过程中面临了多个挑战。首先,数据集的构建基于2023年Kalapa Bytebattles竞赛中的越南语医疗问答部分,这要求对原始数据进行精细的筛选和处理。其次,数据集包含了603种不同的疾病,每种疾病生成20个问题,这需要对医学知识有深入的理解和准确的表达。此外,数据集的多样性和复杂性也带来了数据标注和质量控制的挑战。最后,数据集的使用需严格遵守非商业用途的许可协议,这限制了其在商业应用中的推广和使用。
常用场景
经典使用场景
ViMedical Disease数据集在医疗领域的经典应用场景主要体现在疾病症状的分类与初步诊断。通过该数据集,研究人员可以构建预测模型,识别患者可能患有的疾病,从而为医疗诊断提供初步的参考依据。此外,该数据集还可用于开发智能问答系统,帮助用户了解常见疾病的症状,提升公众的健康意识。
衍生相关工作
ViMedical Disease数据集的发布激发了众多相关研究工作。例如,有研究者基于该数据集开发了疾病预测模型,显著提高了疾病诊断的准确性。此外,还有研究团队利用该数据集构建了智能问答系统,为公众提供了便捷的健康咨询服务。这些衍生工作不仅丰富了医疗领域的研究成果,还推动了相关技术的实际应用。
数据集最近研究
最新研究方向
在医疗数据分析领域,ViMedical Disease数据集的最新研究方向主要集中在疾病症状的自动分类和预测模型的构建上。该数据集通过收集超过12,000个关于常见疾病的问题和症状,为研究人员提供了丰富的资源,以开发能够识别和预测疾病症状的先进算法。此外,该数据集还被用于创建智能对话系统,以提供用户支持,特别是在初步诊断和症状解释方面。这些研究不仅推动了医疗数据科学的发展,还为提高公众健康意识和早期疾病检测提供了新的工具和方法。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作