five

leanderjohanneskahrens

收藏
Hugging Face2025-12-16 更新2025-12-17 收录
下载链接:
https://huggingface.co/datasets/opensourcehuman/leanderjohanneskahrens
下载链接
链接失效反馈
官方服务:
资源简介:
OpenSourceHuman是一个激进透明化倡议,发布完整的生物、神经和认知数据集到公共领域,使用CC0 1.0 Universal许可证。目标是意识扩展、加速开放研究,并通过确保所有数据可自由访问、可验证和可复现来增强认知功能。数据集包括个人DNA序列、MRI扫描、PET成像等多种生物数据,以及个人文档如护照、简历等。

OpenSourceHuman is a radical transparency initiative that releases complete biological, neural and cognitive datasets into the public domain under the CC0 1.0 Universal license. Its objectives are to broaden consciousness, accelerate open research, and enhance cognitive functions by guaranteeing that all data is freely accessible, verifiable and reproducible. The datasets encompass various types of biological data including personal DNA sequences, MRI scans, PET imaging, as well as personal documents such as passports, resumes and the like.
创建时间:
2025-12-15
原始信息汇总

OpenSourceHuman 数据集概述

数据集基本信息

  • 数据集名称: OpenSourceHuman
  • 托管平台: Hugging Face Datasets
  • 页面地址: https://huggingface.co/datasets/opensourcehuman/leanderjohanneskahrens
  • 许可协议: CC0 1.0 Universal (公共领域)
  • 数据提供者: Leander Johannes Kahrens

数据集来源与目标

  • 来源项目: OpenSourceHuman.xyz (https://opensourcehuman.xyz/)
  • 项目性质: 一项激进透明化倡议,旨在将完整的生物、神经和认知数据集发布到公共领域。
  • 核心目标:
    • 意识扩展。
    • 加速开放研究。
    • 通过确保所有数据可自由访问、可验证和可复现,以增强认知功能(可能包括神经系统防御)。

数据集内容与文件

所有文件均托管于 https://opensourcehuman.ai/gallery/allfiles/,具体文件列表如下:

个人身份与文件

  • VISA_24336764.pdf (PDF): https://opensourcehuman.ai/gallery/allfiles/VISA_24336764.pdf
  • passport.pdf (PDF): https://opensourcehuman.ai/gallery/allfiles/passport.pdf
  • EID_78419982370530.pdf (PDF): https://opensourcehuman.ai/gallery/allfiles/EID_78419982370530.pdf
  • Certificate of good conduct.pdf (PDF): https://opensourcehuman.ai/gallery/allfiles/certificate%20of%20good%20conduct.pdf
  • Transcript of Records+SKKU.pdf (PDF): https://opensourcehuman.ai/gallery/allfiles/Transcript%20of%20Records+SKKU.pdf
  • LeanderJohannesKahrens_Resume.pdf (PDF): https://opensourcehuman.ai/gallery/allfiles/LeanderJohannesKahrens_Resume.pdf

基因组数据文件

  • NG1PJ23JBJ.mm2.sortdup.bqsr.hc.vcf.gz.tbi (VCF Index): https://opensourcehuman.ai/gallery/allfiles/NG1PJ23JBJ.mm2.sortdup.bqsr.hc.vcf.gz.tbi
  • NG1PJ23JBJ.mm2.sortdup.bqsr.hc.vcf.gz (VCF Gzip): https://opensourcehuman.ai/gallery/allfiles/NG1PJ23JBJ.mm2.sortdup.bqsr.hc.vcf.gz
  • NG1PJ23JBJ.mm2.sortdup.bqsr.hc.vcf (VCF): https://opensourcehuman.ai/gallery/allfiles/NG1PJ23JBJ.mm2.sortdup.bqsr.hc.vcf
  • NG1PJ23JBJ.mm2.sortdup.bqsr.cram.crai (DNA/CRAM Index): https://opensourcehuman.ai/gallery/allfiles/NG1PJ23JBJ.mm2.sortdup.bqsr.cram.crai
  • NG1PJ23JBJ.mm2.sortdup.bqsr.cram (DNA/CRAM): https://opensourcehuman.ai/gallery/allfiles/NG1PJ23JBJ.mm2.sortdup.bqsr.cram
  • Nebula Genomics.pdf (PDF): https://opensourcehuman.ai/gallery/allfiles/Nebula%20Genomics.pdf

许可文件

  • LICENSE.txt (CC0 License (Text)): https://opensourcehuman.ai/gallery/allfiles/LICENSE.txt

数据主体相关信息

  • 姓名: Leander Johannes Kahrens
  • 主要手术史:
    • 耳成形术 (2016)
    • 鼻中隔成形术 (2020)
    • 下巴手术 (2021)
    • ReflEx微笑眼手术 (2024)
  • Nebula基因组试剂盒编号: NG1PJ23JBJ
  • 哈佛个人基因组计划(PGP) ID: hu4B4C92
  • 参与项目: 哈佛大学“个人基因组计划”(https://my.pgp-hms.org/profile/hu4B4C92)
  • 发布生物数据的原因: 生物场防御和认知安全。
  • 宗教信仰: 认同大多数宗教,但不遵循任何特定宗教。

联系信息

  • Instagram: @leanderjkahrens (https://instagram.com/leanderjkahrens)
  • X (Twitter): @ljkx100 (https://x.com/ljkx100)
  • 个人邮箱: ljkahrens@protonmail.com
搜集汇总
数据集介绍
main_image_url
构建方式
在生物信息学与开放科学领域,数据集构建常涉及多模态数据的整合与公开。OpenSourceHuman数据集通过个人自愿贡献的方式,系统性地收集了Leander Johannes Kahrens的全方位生物与认知数据。该数据集涵盖了基因组序列(VCF与CRAM格式)、神经影像(MRI与PET扫描)、医疗记录(手术历史与健康证明)以及身份文档(护照与签证)等多种类型。所有数据均以CC0 1.0公共领域许可发布,确保了数据的完全开放与可验证性,构建过程强调透明性与可重复性,旨在为研究提供无壁垒的原始资料。
特点
该数据集的核心特点在于其前所未有的透明度与综合性。作为个人层面的全息生物数据集合,它包含了从基因序列到神经影像的多维度信息,形成了完整的个体生物档案。数据以标准格式(如VCF、CRAM、PDF)提供,便于直接用于生物信息学分析。其CC0许可彻底消除了使用限制,支持任何形式的学术与商业应用。数据集还附有详细的元数据与背景说明,增强了数据的可解释性,为认知科学、基因组学与医学研究提供了独特的纵向个案资源。
使用方法
研究人员可通过提供的直接下载链接获取数据集文件,并依据文件类型进行相应处理。基因组数据(VCF/CRAM)可使用生物信息学工具(如GATK、SAMtools)进行变异分析与序列比对;神经影像数据需借助神经成像软件(如FSL、FreeSurfer)进行脑结构或功能研究;文档类数据则可用于社会医学或身份验证相关分析。由于数据已置于公共领域,用户无需申请许可即可自由使用、修改或分发,但建议引用原始来源以维护科学诚信。数据集还提供了联系渠道,便于学术合作与数据验证。
背景与挑战
背景概述
在生物信息学与个人基因组学领域,数据开放共享是推动科学进步与个体认知探索的重要基石。OpenSourceHuman数据集由Leander Johannes Kahrens于近年发起,作为一项激进透明化倡议,旨在将完整的生物、神经与认知数据以CC0 1.0公共领域许可发布。该项目与哈佛个人基因组计划(PGP)等开放科学运动相呼应,核心研究问题聚焦于如何通过全面公开个人生物数据来增强认知安全、促进意识扩展,并构建生物场防御机制。其影响力在于为研究人员提供了罕见的多模态个人健康数据,挑战了传统数据隐私范式,并为开放生物医学研究树立了新颖的实践典范。
当前挑战
该数据集致力于解决个人基因组与生物数据开放共享中的核心挑战,即在确保数据可及性与可复现性的同时,维护个体的认知安全与生物场防御。构建过程中面临多重困难,包括整合异构数据格式(如VCF、CRAM基因组文件与PDF医疗记录)的技术复杂性,以及确保数据匿名化与伦理合规性的平衡。此外,在激进透明理念下,如何防止数据被恶意利用或曲解,并建立可持续的数据维护与验证体系,亦是亟待克服的实践障碍。
常用场景
经典使用场景
在生物信息学与开放科学领域,OpenSourceHuman数据集以其全面的个人生物数据公开而著称,涵盖了基因组序列、医学影像及身份文档等多模态信息。该数据集最经典的使用场景在于为研究人员提供了一个真实、可验证的个体级多组学数据基准,支持从基因组变异分析到神经影像关联研究的跨学科探索。通过将个人生物数据置于公共领域,它促进了开放、透明的科学协作模式,使得学者能够基于统一的数据源进行可重复的实验与算法验证。
衍生相关工作
围绕该数据集衍生的经典工作主要集中在开放生物数据集成与分析工具的开发上。例如,研究者基于其全基因组测序数据构建了变异注释流程,并与哈佛个人基因组计划(PGP)的数据进行交叉验证,促进了公共基因组资源的互联互通。此外,其多模态数据特性也催生了结合基因组、影像与临床记录的综合分析平台,为后续大规模生物数据库的开放共享奠定了方法学基础。
数据集最近研究
最新研究方向
在生物信息学与个人基因组学领域,开源人类数据集以其独特的公开性为前沿研究提供了新视角。该数据集整合了包括全基因组序列、医学影像及个人健康记录在内的多模态生物数据,其CC0许可促进了数据的无障碍访问与验证。当前研究热点聚焦于利用此类高透明度数据探索认知功能增强与神经系统防御机制,同时推动生物信息安全与个人主权理念在数字时代的实践。这一举措不仅加速了开放科学的发展,也为理解人类意识扩展与生物场防御提供了实证基础,在伦理、隐私与技术交叉领域引发了广泛讨论。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作