kimou605/TATA-NOTATA-FineMistral-nucleotide_transformer_downstream_tasks

Name: kimou605/TATA-NOTATA-FineMistral-nucleotide_transformer_downstream_tasks
Creator: kimou605
Published: 2024-05-06 16:12:09
License: 暂无描述

Hugging Face2024-05-06 更新2024-06-12 收录

下载链接：

https://hf-mirror.com/datasets/kimou605/TATA-NOTATA-FineMistral-nucleotide_transformer_downstream_tasks

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集专门用于微调Mistral模型，以区分tata和no tata序列。数据集来源于InstaDeep，并经过重新格式化以提升自然语言处理模型在识别特定模式方面的性能。数据集包含两个分割：训练集和测试集，分别包含53,276和5,920个示例。

提供机构：

kimou605

原始信息汇总

数据集概述

数据集名称

Dataset for Fine-tuning Mistral Model on Tata and No Tata Sequences

数据集描述

该数据集专为训练Mistral模型以区分tata和no tata序列而设计。它源自InstaDeep创建的原始数据集，经过调整以提升自然语言处理模型在识别特定模式上的性能。

数据集信息

特征

名称: text
数据类型: string

数据分割

训练集: 53,276 examples
测试集: 5,920 examples

详细数据

训练集:
- 示例数量: 53,276
- 数据大小: 18,491,278 bytes
测试集:
- 示例数量: 5,920
- 数据大小: 2,054,722 bytes

数据集大小

下载大小: 9,488,224 bytes
总数据集大小: 20,546,000 bytes

配置

配置名称: default
数据文件路径:
- 训练集: data/train-*
- 测试集: data/test-*

许可证

apache-2.0

任务类别

text-generation