有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
giovannidemuri__sharegpt-ex50000-seed5_llama8b-er-v573-seed2-hx_256_ngt0.7_tp0.9
该数据集包含了用户与助手之间的对话,其中包含两个字段:用户发言和助手回应,均为字符串类型。训练集大小为38646852字节,共有44096条对话记录。
huggingface 收录
NCBI
美国国家生物技术信息中心(NCBI)是一个国际知名的生物信息学数据库和研究机构,提供广泛的生物医学数据资源和工具。其官方网站涵盖了基因组学、蛋白质组学、生物医学文献等多个领域的数据,为全球科研人员、临床医生和学生提供免费访问和分析生物信息的平台,推动生命科学和医学研究的发展。
www.ncbi.nlm.nih.gov 收录
Human Protein Atlas
Human Protein Atlas数据集包含了人类蛋白质的详细信息,包括蛋白质在不同组织和细胞类型中的表达模式、亚细胞定位、蛋白质相互作用等。该数据集还提供了大量的图像数据,展示了蛋白质在组织切片中的定位。
www.proteinatlas.org 收录
Plant-Diseases
Dataset for Plant Diseases containg variours Plant Disease
kaggle 收录
Kaggle Titanic
该数据集包含了泰坦尼克号乘客的信息,包括乘客的年龄、性别、船舱等级、是否幸存等。主要用于机器学习中的分类任务,预测乘客是否幸存。
www.kaggle.com 收录