katielink/healthsearchqa|医疗问答数据集|消费者健康数据集
收藏数据集概述
基本信息
- 名称: HealthSearchQA
- 许可证: 未知
- 语言: 英语
- 标签: 医疗
- 任务类别: 问答
数据集详情
- 来源: 由Google发布,用于Med-PaLM论文
- 描述: 包含3,173个常见的消费者健康问题,使用种子医学条件及其相关症状进行筛选,旨在反映真实世界的消费者关注点。
- 格式: 问题仅包含自由文本响应,属于开放领域。
- 大小: 3,173个问题
数据配置
- 配置1: all_data
- 文件名: all.csv
- 配置2: 140_question_subset
- 文件名: multimedqa140_subset.csv
数据集大小
- 范围: 1K<n<10K
Materials Project 在线材料数据库
Materials Project 是一个由伯克利加州大学和劳伦斯伯克利国家实验室于 2011 年共同发起的大型开放式在线材料数据库。这个项目的目标是利用高通量第一性原理计算,为超过百万种无机材料提供全面的性能数据、结构信息和计算模拟结果,以此加速新材料的发现和创新过程。数据库中的数据不仅包括晶体结构和能量特性,还涵盖了电子结构和热力学性质等详尽信息,为研究人员提供了丰富的材料数据资源。相关论文成果为「Commentary: The Materials Project: A materials genome approach to accelerating materials innovation」。
超神经 收录
OMIM (Online Mendelian Inheritance in Man)
OMIM是一个包含人类基因和遗传疾病信息的在线数据库。它提供了详细的遗传疾病描述、基因定位、相关文献和临床信息。数据集内容包括疾病名称、基因名称、基因定位、遗传模式、临床特征、相关文献引用等。
www.omim.org 收录
VoxBox
VoxBox是一个大规模语音语料库,由多样化的开源数据集构建而成,用于训练文本到语音(TTS)系统。
github 收录
Asteroids by the Minor Planet Center
包含所有已知小行星的轨道数据和观测数据。数据来源于Minor Planet Center,格式包括Fortran (.DAT)和JSON,数据集大小为81MB(压缩)和450MB(未压缩),记录数约750,000条,每日更新。
github 收录
LinkedIn Salary Insights Dataset
LinkedIn Salary Insights Dataset 提供了全球范围内的薪资数据,包括不同职位、行业、地理位置和经验水平的薪资信息。该数据集旨在帮助用户了解薪资趋势和市场行情,支持职业规划和薪资谈判。
www.linkedin.com 收录