five

ferrazzipietro/LS_Llama-2-7b-hf_adapters_en.layer1_NoQuant_64_32_0.05_2_0.0002_5EpochsBestF1Train

收藏
Hugging Face2024-05-16 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/ferrazzipietro/LS_Llama-2-7b-hf_adapters_en.layer1_NoQuant_64_32_0.05_2_0.0002_5EpochsBestF1Train
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含了多种特征,包括句子、实体信息(如实体ID、偏移量、角色、语义类型ID、文本和类型)、原始文本、原始ID、分词、命名实体识别标签、输入ID、注意力掩码、标签、预测和真实标签。数据集主要用于自然语言处理任务,特别是命名实体识别和文本分析。

该数据集包含了多种特征,包括句子、实体信息(如实体ID、偏移量、角色、语义类型ID、文本和类型)、原始文本、原始ID、分词、命名实体识别标签、输入ID、注意力掩码、标签、预测和真实标签。数据集主要用于自然语言处理任务,特别是命名实体识别和文本分析。
提供机构:
ferrazzipietro
原始信息汇总

数据集概述

数据集特征

  • sentence
    • 数据类型:字符串
  • entities
    • id
      • 数据类型:字符串
    • offsets
      • 数据类型:整数序列(int64)
    • role
      • 数据类型:字符串
    • semantic_type_id
      • 数据类型:字符串
    • text
      • 数据类型:字符串
    • type
      • 数据类型:字符串
  • original_text
    • 数据类型:字符串
  • original_id
    • 数据类型:字符串
  • tokens
    • 数据类型:字符串序列
  • ner_tags
    • 数据类型:整数序列(int64)
  • input_ids
    • 数据类型:整数序列(int32)
  • attention_mask
    • 数据类型:整数序列(int8)
  • labels
    • 数据类型:整数序列(int64)
  • predictions
    • 数据类型:字符串序列
  • ground_truth_labels
    • 数据类型:字符串序列

数据集分割

  • 测试集(test)
    • 数据大小:2785371字节
    • 示例数量:681

数据集大小

  • 下载大小:318157字节
  • 数据集总大小:2785371字节

配置

  • 默认配置(default)
    • 数据文件路径:data/test-*
二维码
社区交流群
二维码
科研交流群
商业服务