five

BioASQ|生物医学数据集|自然语言处理数据集

收藏
OpenDataLab2025-03-29 更新2024-05-09 收录
生物医学
自然语言处理
下载链接:
https://opendatalab.org.cn/OpenDataLab/BioASQ
下载链接
链接失效反馈
资源简介:
BioASQ问答 (QA) 基准数据集包含英语问题,以及黄金标准 (参考) 答案和相关材料。该数据集旨在反映生物医学专家的真实信息需求,因此比大多数现有数据集更现实,更具挑战性。此外,与以前大多数仅包含确切答案的QA基准不同,bioasq-qa数据集还包括理想答案 (实际上是摘要),这对于多文档摘要的研究特别有用。数据集结合了结构化和非结构化数据。与每个问题相关的材料包括文档和摘要,这些文档和摘要对于信息检索和段落检索实验很有用,以及在概念到文本自然语言生成中很有用的概念。研究解释和文本包含的研究人员还可以衡量其方法改善生物医学质量保证系统性能的程度。最后但并非最不重要的一点是,随着BioASQ挑战的运行并生成新数据,数据集不断扩展。
提供机构:
OpenDataLab
创建时间:
2023-09-04
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

学生课堂行为数据集 (SCB-dataset3)

学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。

arXiv 收录

ST-EVCDP

这是一个关于公共电动汽车充电桩的时空充电需求预测的实际数据集,涵盖了18,061个公共充电桩的数据,包括坐标、充电器数量、占用情况和价格等信息。数据集用于学术研究,支持区域电动汽车充电需求预测。

github 收录

猫狗图像数据集

该数据集包含猫和狗的图像,每类各12500张。训练集和测试集分别包含10000张和2500张图像,用于模型的训练和评估。

github 收录

EV Charging Network Data

该数据集包含了电动汽车充电网络的相关信息,包括充电站的位置、充电桩的数量、充电速度、运营商信息等。数据集旨在帮助研究人员和开发者分析和优化电动汽车充电网络的布局和效率。

afdc.energy.gov 收录

MedDialog

MedDialog数据集(中文)包含了医生和患者之间的对话(中文)。它有110万个对话和400万个话语。数据还在不断增长,会有更多的对话加入。原始对话来自好大夫网。

github 收录