ferrazzipietro/LS_Llama-2-7b-hf_adapters_en.layer1_NoQuant_64_64_0.01_2_0.0002_5EpochsBestF1Train

Name: ferrazzipietro/LS_Llama-2-7b-hf_adapters_en.layer1_NoQuant_64_64_0.01_2_0.0002_5EpochsBestF1Train
Creator: ferrazzipietro
Published: 2024-05-16 10:59:29
License: 暂无描述

Hugging Face2024-05-16 更新2024-06-12 收录

下载链接：

https://hf-mirror.com/datasets/ferrazzipietro/LS_Llama-2-7b-hf_adapters_en.layer1_NoQuant_64_64_0.01_2_0.0002_5EpochsBestF1Train

下载链接

链接失效反馈

官方服务：

资源简介：

--- dataset_info: features: - name: sentence dtype: string - name: entities list: - name: id dtype: string - name: offsets sequence: int64 - name: role dtype: string - name: semantic_type_id dtype: string - name: text dtype: string - name: type dtype: string - name: original_text dtype: string - name: original_id dtype: string - name: tokens sequence: string - name: ner_tags sequence: int64 - name: input_ids sequence: int32 - name: attention_mask sequence: int8 - name: labels sequence: int64 - name: predictions sequence: string - name: ground_truth_labels sequence: string splits: - name: test num_bytes: 2785371 num_examples: 681 download_size: 318258 dataset_size: 2785371 configs: - config_name: default data_files: - split: test path: data/test-* ---

数据集信息：特征字段： - 名称：句子（sentence），数据类型：字符串（string） - 名称：实体集（entities），为列表类型，包含以下子字段： - 标识符（id），数据类型：字符串（string） - 偏移量（offsets），为64位整型序列（int64） - 角色（role），数据类型：字符串（string） - 语义类型标识符（semantic_type_id），数据类型：字符串（string） - 文本（text），数据类型：字符串（string） - 类型（type），数据类型：字符串（string） - 名称：原始文本（original_text），数据类型：字符串（string） - 名称：原始标识符（original_id），数据类型：字符串（string） - 名称：令牌序列（tokens），为字符串序列 - 名称：命名实体识别标签（ner_tags），为64位整型序列（int64） - 名称：输入标识符（input_ids），为32位整型序列（int32） - 名称：注意力掩码（attention_mask），为8位整型序列（int8） - 名称：标签（labels），为64位整型序列（int64） - 名称：预测结果（predictions），为字符串序列 - 名称：真实标注标签（ground_truth_labels），为字符串序列数据集划分： - 划分名称：测试集（test），占用字节数：2785371，样本数量：681 下载大小：318258，数据集总大小：2785371 配置项： - 配置名称：默认配置（default），数据文件： - 划分：测试集（test），文件路径：data/test-*

提供机构：

ferrazzipietro

原始信息汇总

数据集概述

数据集特征

sentence: 数据类型为字符串。
entities: 包含以下子特征：
- id: 数据类型为字符串。
- offsets: 数据类型为整数序列。
- role: 数据类型为字符串。
- semantic_type_id: 数据类型为字符串。
- text: 数据类型为字符串。
- type: 数据类型为字符串。
original_text: 数据类型为字符串。
original_id: 数据类型为字符串。
tokens: 数据类型为字符串序列。
ner_tags: 数据类型为整数序列。
input_ids: 数据类型为整数序列。
attention_mask: 数据类型为字节整数序列。
labels: 数据类型为整数序列。
predictions: 数据类型为字符串序列。
ground_truth_labels: 数据类型为字符串序列。

数据集分割

test:
- 数据大小: 2785371 字节
- 示例数量: 681

数据集大小

下载大小: 318258 字节
数据集总大小: 2785371 字节

配置

config_name: default
data_files:
- split: test
- path: data/test-*