five

datasets.simula.no

收藏
github2024-05-21 更新2024-05-31 收录
下载链接:
https://github.com/simula/datasets.simula.no
下载链接
链接失效反馈
官方服务:
资源简介:
由Simula研究实验室和SimulaMet发布的一系列开放数据集,涵盖医学、生物学、体育等多个领域。

A series of open datasets released by Simula Research Laboratory and SimulaMet, covering multiple disciplines such as medicine, biology, sports and other fields.
创建时间:
2022-02-17
原始信息汇总

数据集概述

医疗和生物学数据集

  • Depresjon: 抑郁症数据集。
  • HyperKvasir: 最大的胃肠道数据集。
  • HYPERAKTIV: 多动症患者运动活动数据库。
  • KvasirCapsule SEG: 胶囊内窥镜分割数据集。
  • Cellular: 细胞自噬数据集。
  • GastroVision: 多中心数据集。
  • Nerthus: 肠道准备质量视频数据集。
  • Kvasir Capsule: 最大的胃肠道PillCAM数据集。
  • Kvasir Instrument: 胃肠道器械数据集。
  • Kvasir SEG: 用于计算机辅助胃肠道疾病检测的分段息肉数据集。
  • Kvasir: 用于计算机辅助胃肠道疾病检测的多类别图像数据集。
  • Psykose: 精神分裂症患者运动活动数据库。
  • VISEM QC: 精子质量控制数据集。
  • VISEM: 人类精子多模态视频数据集。

体育数据集

  • Alfheim: 足球视频和球员位置数据集。
  • ARX: 包含挪威足球文章的文本分类数据集。
  • Heimdallr: 体育分析数据集。
  • ScopeSense: 8.5个月的体育、营养和生活方式生命日志数据集。
  • Soccer Summarization: 足球比赛英文摘要数据集。
  • SoccerMon: 两个不同精英女子足球队两年收集的主观和客观数据。
  • SoccerSum: 用于足球场上物体自动检测、分割和跟踪的数据集。
  • SoccerNet-Echoes: 足球比赛音频解说数据集。
  • PMData: 使用Fitbit、Google Forms和PMSys收集的16人在5个月的生命日志数据集。
  • TACDEC: 足球比赛视频中的铲球事件数据集。

其他数据集

  • Anarchy Online: 来自Anarchy Online的服务器端网络流量数据集。
  • European Cloud Cover: 包含ERA5再分析数据和METeosat第二代卫星反演数据的数据集。
  • Eye Tracker: 基于严肃游戏的数据集。
  • HSDPA: 移动HTTP流场景的HSDPA带宽日志。
  • HTAD: 包含手腕加速度计和音频特征的家庭任务活动数据集。
  • Image Sentiment: 图像情感分析数据集。
  • Njord: 渔船数据集。
  • Right Inflight: 用于探索适合观看情况的电影自动预测的数据集。
  • THREAT: 用于检测暴力威胁的大型标注语料库。
  • Toadstool: 用于训练情感智能机器玩超级马里奥兄弟的数据集。
  • WICO Graph Dataset: 基于阴谋论和5G-Corona错误信息的Twitter子图标注数据集。
  • WICO Text: 包含阴谋论和5G-Corona错误信息的标注推文数据集。
搜集汇总
数据集介绍
main_image_url
构建方式
datasets.simula.no 数据集由 Simula Research Laboratory 和 SimulaMet 发布,涵盖了多个领域的开放数据集。这些数据集的构建方式主要通过收集和整理来自不同来源的数据,如医学影像、生物信号、体育活动记录等。每个数据集都经过严格的筛选和标注,确保数据的准确性和可用性。此外,数据集的构建还依赖于相关领域的专业知识和研究成果,以确保数据集的科学性和实用性。
特点
该数据集的特点在于其多样性和专业性。首先,数据集涵盖了医学、生物学、体育等多个领域,为跨学科研究提供了丰富的资源。其次,每个数据集都附有详细的研究论文和代码链接,便于用户理解和应用。此外,数据集的构建过程严格遵循科学标准,确保数据的可靠性和一致性。最后,数据集的开放性使得全球研究者都能访问和使用,促进了知识的共享和创新。
使用方法
使用 datasets.simula.no 数据集时,用户首先需要访问数据集的GitHub页面,选择所需的数据集并下载。每个数据集都附有详细的README文件,包含数据集的描述、构建方法、相关论文和代码链接等信息。用户可以根据README文件中的指导,使用相应的工具和方法对数据进行处理和分析。此外,用户还可以通过GitHub的贡献机制,提交新的数据集或改进现有数据集,促进数据集的不断完善和扩展。
背景与挑战
背景概述
datasets.simula.no 是由Simula Research Laboratory和SimulaMet共同发布的一系列开放数据集的集合。该数据集涵盖了多个领域,包括医学与生物学、体育以及其他领域。自发布以来,这些数据集已成为相关研究的重要资源,特别是在计算机辅助疾病检测、运动分析和情感分析等领域。Simula的研究团队通过这些数据集,不仅推动了学术研究的发展,也为实际应用提供了宝贵的数据支持。
当前挑战
尽管datasets.simula.no在多个领域展现了其重要性,但其构建和维护过程中仍面临诸多挑战。首先,数据集的多样性要求研究人员在不同领域具备专业知识,以确保数据的准确性和可靠性。其次,数据集的更新和扩展需要持续的资源投入,包括人力和计算资源。此外,数据集的隐私和安全问题也是不可忽视的挑战,特别是在涉及敏感信息的医学和生物学数据集中。
常用场景
经典使用场景
在医学与生物学领域,datasets.simula.no 提供了多个经典数据集,如 Depresjon 数据集用于抑郁症研究,HyperKvasir 数据集则广泛应用于胃肠道疾病的计算机辅助检测。这些数据集通过丰富的图像和视频数据,支持了深度学习模型在医学影像分析中的应用,显著提升了疾病诊断的准确性和效率。
衍生相关工作
基于这些数据集,研究人员开发了多种先进的算法和模型,如用于胃肠道疾病检测的深度学习模型、抑郁症患者的活动分析系统等。这些工作不仅在学术界产生了广泛影响,还为相关领域的实际应用提供了坚实的基础,推动了医学影像分析技术的快速发展。
数据集最近研究
最新研究方向
在医学与生物学领域,datasets.simula.no 提供了多个前沿数据集,如Depresjon、HyperKvasir和KvasirCapsule,这些数据集在抑郁症诊断、胃肠道疾病检测和胶囊内窥镜图像分析等方面展现了显著的研究潜力。特别是KvasirCapsule,作为最大的胃肠道PillCAM数据集,其在计算机辅助诊断中的应用正受到广泛关注。此外,在体育领域,SoccerNet-Echoes和TACDEC等数据集为足球比赛分析提供了丰富的资源,推动了自动化检测和跟踪技术的发展。这些数据集不仅为相关领域的研究提供了坚实的基础,还促进了跨学科的交流与合作,进一步推动了人工智能在实际应用中的创新与突破。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作