jtatman/medical_biological_instruction_format
收藏Hugging Face2024-02-01 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/jtatman/medical_biological_instruction_format
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为medical_biological_instruction_format,包含三个主要字段:问题(question)、答案(answer)和指令(instruction)。数据集分为训练集(train),包含3000个样本,总大小为4328618字节。建议用户在处理时可以考虑删除instruction列,或使用高效的LLM生成变体提示。对于医学和科学数据库的扩展,推荐使用特定的模型,如SciPhi/SciPhi-Mistral-7B-32k等。
该数据集名为medical_biological_instruction_format,包含三个主要字段:问题(question)、答案(answer)和指令(instruction)。数据集分为训练集(train),包含3000个样本,总大小为4328618字节。建议用户在处理时可以考虑删除instruction列,或使用高效的LLM生成变体提示。对于医学和科学数据库的扩展,推荐使用特定的模型,如SciPhi/SciPhi-Mistral-7B-32k等。
提供机构:
jtatman
原始信息汇总
数据集概述
数据集信息
- 特征:
question: 类型为字符串answer: 类型为字符串instruction: 类型为字符串
- 分割:
train: 包含4328618字节的数据,共3000个样本
- 下载大小: 1750950字节
- 数据集大小: 4328618字节
配置
- 默认配置:
- 数据文件:
train: 路径为data/train-*
- 数据文件:



