five

nlpie/Llama2-MedTuned-Instructions

收藏
Hugging Face2024-12-03 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/nlpie/Llama2-MedTuned-Instructions
下载链接
链接失效反馈
官方服务:
资源简介:
Llama2-MedTuned-Instructions是一个基于指令的数据集,专为训练生物医学NLP任务中的语言模型而开发。它包含大约200,000个样本,每个样本都设计为引导模型执行特定任务,如命名实体识别(NER)、关系提取(RE)和医学自然语言推理(NLI)。该数据集融合了多个现有的生物医学数据源,并重新格式化以支持基于指令的学习。每个样本遵循三部分结构:指令、输入和输出,以确保任务指令和预期结果的清晰性。

Llama2-MedTuned-Instructions is an instruction-based dataset developed for training language models in biomedical NLP tasks. It consists of approximately 200,000 samples, each tailored to guide models in performing specific tasks such as Named Entity Recognition (NER), Relation Extraction (RE), and Medical Natural Language Inference (NLI). This dataset represents a fusion of various existing data sources, reformatted to facilitate instruction-based learning. Each sample follows a three-part structure: Instruction, Input, and Output, ensuring clarity in task directives and expected outcomes.
提供机构:
nlpie
原始信息汇总

Llama2-MedTuned-Instructions 数据集概述

数据集简介

Llama2-MedTuned-Instructions 是一个面向生物医学自然语言处理任务的指令型数据集。

数据规模

该数据集包含约 200,000 个样本。

数据用途

每个样本均针对特定任务进行定制,包括:

  • 命名实体识别(NER)
  • 关系抽取(RE)
  • 医学自然语言推理(NLI)

数据来源

该数据集融合了多种现有数据源,并进行了格式重整,以促进指令型学习。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作