five

Transgenic Mouse Enhancer Assay - Vista Enhancer ID: mm426|转基因小鼠数据集|增强子分析数据集

收藏
Mendeley Data2024-01-31 更新2024-06-27 收录
转基因小鼠
增强子分析
下载链接:
https://www.facebase.org/chaise/record/#1/isa:dataset/RID=TT6
下载链接
链接失效反馈
资源简介:
See link to the data preparation protocols for this study in the Additional Information section See links to Genome Browser in the Additional Information section. **Enhancer location:** Mouse genome mm9, chr5:38216912-38220459 **Name:** mCF112 **Vista Enhancer ID:** mm426 **Nearest craniofacial gene or locus:** Msx1 **Enhancer expression:** positive **Tissues where active:** branchial arch, ear, eye, facial mesenchyme, genital tubercle, hindbrain, limb, midbrain, nose, somite This data set includes the following: * A .pdf file that summarizes the whole-mount data for the tested element. This file includes light microscopy whole-mount images of the LacZ reporter gene expression in mouse embryos, a summary of the annotation of the expression pattern, the DNA sequence of the tested element in Fasta format, and the sequences of the primers used to generate the test construct. Follow corresponding link in the Additional Information section to see this information in the Vista Enhancer Browser at Lawrence Berkeley Laboratory * 3 movie (.avi) files: 3-D modesl generated by Optical Projection Tomography (OPT). Thresholding-based false-color representation shows unstained regions of the embryo in green, LacZ signal in red. Each of the movies represents a pass-through view of the OPT model in the coronal, sagittal, or transverse plane. See links in External Referece section to download the following movie files: Coronal plane movie, Sagittal plane movie, Transverse plane movie * 4 files in .tgz format. Each of these corresponds to one of the .avi files and unzips to a set of .png files, each of which represents the individual frames of the movie (and, in case of the transverse/sagittal/coronal movies, can be used to retrieve individual virtual sections through features of interest in .png image format). [.tgz files can be unzipped with WinZip or Stuffit on a PC or Mac. On linux, treat the file as a gzipped .tar file: gunzip < file.tgz | tar xvf - ] * Tested element.txt: Download the text files mCF112metadata.txt and mCF112Lmetadata.txt from the External Reference section .
创建时间:
2024-01-31
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4099个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

Figshare

Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。

figshare.com 收录

MNBVC

MNBVC数据集是一个超大规模的中文语料集,包括新闻、作文、小说、书籍、杂志、论文、台词、帖子、wiki、古诗、歌词、商品介绍、笑话、糗事、聊天记录等一切形式的纯文本中文数据。数据集不但包括主流文化,也包括各个小众文化甚至火星文的数据。

github 收录

MeSH

MeSH(医学主题词表)是一个用于索引和检索生物医学文献的标准化词汇表。它包含了大量的医学术语和概念,用于描述医学文献中的主题和内容。MeSH数据集包括主题词、副主题词、树状结构、历史记录等信息,广泛应用于医学文献的分类和检索。

www.nlm.nih.gov 收录

OpenML-CC18

我们提倡使用经过整理的、全面的机器学习数据集基准测试套件,以标准化的基于 OpenML 的接口和用 Python、Java 和 R 编写的互补软件工具包为后盾。我们展示了如何使用标准化的基于 OpenML 的基准测试套件轻松执行全面的基准测试研究以及用 Python、Java 和 R 编写的互补软件工具包。 OpenML 基准测试套件的主要显着特点是 (i) 通过标准化数据格式、API 和现有客户端库易于使用; (ii) 关于套件内容的机器可读元信息; (iii) 在线共享结果,实现大规模比较。作为第一个这样的套件,我们提出了 OpenML-CC18,这是一个机器学习基准套件,包含 72 个分类数据集,从 OpenML 上的数千个数据集中精心策划。纳入标准是: * 密集数据集独立观察的分类任务 * 类数 >= 2,每个类至少有 20 个观察和少数类与多数类的比例必须超过 5% * 500 <= 观察数 <= 100000 * one-hot-encoding 后的特征数量 < 5000 * 没有人工数据集 * 没有更大数据集的子集,也没有其他数据集的二值化 * 没有可以通过使用单个特征或使用简单的决策树来完全预测的数据集* 来源或参考可用 如果您使用此基准测试套件,请引用:Bernd Bischl、Giuseppe Casalicchio、Matthias Feurer、Frank Hutter、Michel Lang、Rafael G. Mantovani、Jan N. van Rijn 和 Joaquin Vanschoren。 “OpenML 基准测试套件”arXiv:1708.03731v2 [stats.ML] (2019)。 @article{oml-benchmarking-suites, title={OpenML Benchmarking Suites}, author={Bernd Bischl and Giuseppe Casalicchio and Matthias Feurer and Frank Hutter and Michel Lang and Rafael G. Mantovani and Jan N. van Rijn and Joaquin Vanschoren},年={2019},日记={arXiv:1708.03731v2 [stat.ML]} }

OpenDataLab 收录

DeepLesion

美国国立卫生研究院临床中心公开了一个大规模的 CT 图像数据集,以帮助科学界提高病变检测的准确性。虽然大多数公开可用的医学图像数据集只有不到一千个病灶,但这个名为 DeepLesion 的数据集在 CT 图像上识别出超过 32,000 个带注释的病灶 (220GB)。 DeepLesion,一个数据集,包含 32,120 个 CT 切片中的 32,735 个病灶,来自 4,427 名独特患者的 10,594 项研究。该数据集中有多种病变类型,例如肺结节、肝脏肿瘤、淋巴结肿大等。它具有用于各种医学图像应用的潜力

OpenDataLab 收录