five

ferrazzipietro/LS_Llama-2-7b-hf_adapters_en.layer1_NoQuant_16_32_0.01_1_0.0002_6Epochs_clent

收藏
Hugging Face2024-06-04 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/ferrazzipietro/LS_Llama-2-7b-hf_adapters_en.layer1_NoQuant_16_32_0.01_1_0.0002_6Epochs_clent
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集主要用于自然语言处理任务,特别是命名实体识别(NER)。数据集包含多个特征,如句子、实体、原始文本、原始ID、分词、NER标签、输入ID、注意力掩码、标签、预测和真实标签。这些特征表明数据集可能用于训练和评估NER模型。数据集仅包含一个测试集,包含681个样本,文件大小为2583947字节。

该数据集主要用于自然语言处理任务,特别是命名实体识别(NER)。数据集包含多个特征,如句子、实体、原始文本、原始ID、分词、NER标签、输入ID、注意力掩码、标签、预测和真实标签。这些特征表明数据集可能用于训练和评估NER模型。数据集仅包含一个测试集,包含681个样本,文件大小为2583947字节。
提供机构:
ferrazzipietro
原始信息汇总

数据集概述

数据集特征

  • sentence:字符串类型
  • entities:列表类型,包含以下字段:
    • id:字符串类型
    • offsets:整数序列(int64)
    • role:字符串类型
    • semantic_type_id:字符串类型
    • text:字符串类型
    • type:字符串类型
  • original_text:字符串类型
  • original_id:字符串类型
  • tokens:字符串序列
  • ner_tags:整数序列(int64)
  • input_ids:整数序列(int32)
  • attention_mask:整数序列(int8)
  • labels:整数序列(int64)
  • predictions:字符串序列
  • ground_truth_labels:字符串序列

数据集分割

  • test
    • 字节数:2583947
    • 示例数:681

数据集大小

  • 下载大小:256090字节
  • 数据集大小:2583947字节
二维码
社区交流群
二维码
科研交流群
商业服务