Dataset Lifecycle Framework
收藏arXiv2021-02-25 更新2024-08-06 收录
下载链接:
http://arxiv.org/abs/2103.00490v1
下载链接
链接失效反馈官方服务:
资源简介:
Dataset Lifecycle Framework(数据集生命周期框架)是由欧洲分子生物学实验室 - 欧洲生物信息学研究所开发的,旨在简化生物信息学管道对云存储的访问。该框架通过创建数据集自定义资源定义(CRD),允许用户在Kubernetes环境中直接访问远程数据源。数据集支持多种存储类型,如S3和NFS,适用于机器学习(ML)和非ML生物信息学管道。此框架不仅简化了数据访问流程,还提高了安全性,并通过缓存机制显著提升了性能。它适用于需要本地文件系统访问的HPC应用迁移到云环境。
提供机构:
欧洲分子生物学实验室 - 欧洲生物信息学研究所
创建时间:
2021-02-25



