five

Bgee

收藏
arXiv2025-09-30 收录
下载链接:
http://purl.org/sib-rdf/bgee-tutorial
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个生命科学领域的科学知识库,名为Bgee,其中包含了跨多种物种的基因表达数据。该数据集以免费许可(CC0)形式发布,并通过增加多种查询变体,以提高机器学习模型性能。该数据集规模庞大,包含数十亿个三元组;原始数据集包含15个查询,经增强后查询数量超过2500个。相关任务是Sparql查询生成。

This dataset is a scientific knowledge base in the life sciences domain, named Bgee, which contains gene expression data across multiple species. Released under the CC0 free license, it has been augmented with diverse query variants to improve the performance of machine learning models. As a large-scale dataset, it contains billions of triples. The original dataset includes 15 queries, and the number of queries exceeds 2500 after augmentation. The relevant task is SPARQL query generation.
提供机构:
Bgee team
搜集汇总
背景与挑战
背景概述
Bgee是一个生命科学领域的科学知识库,专注于跨物种基因表达数据,以CC0免费许可发布,规模达数十亿三元组;通过增强查询变体(从15个增至超过2500个)来提升机器学习模型性能,适用于Sparql查询生成任务。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作