ferrazzipietro/LS_Llama-2-7b-hf_adapters_en.layer1_NoQuant_32_64_0.05_4_0.0002_5EpochsBestF1Train
收藏Hugging Face2024-05-16 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/ferrazzipietro/LS_Llama-2-7b-hf_adapters_en.layer1_NoQuant_32_64_0.05_4_0.0002_5EpochsBestF1Train
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个字段,主要用于自然语言处理任务。主要字段包括句子文本(sentence)、实体信息(entities)、原始文本(original_text)等。实体信息字段是一个列表,包含实体的ID、偏移量、角色、语义类型ID、文本和类型等信息。数据集还包含分词结果(tokens)、命名实体识别标签(ner_tags)、输入ID(input_ids)、注意力掩码(attention_mask)、标签(labels)、预测结果(predictions)和真实标签(ground_truth_labels)。数据集包含一个测试集(test),共有681个示例,文件大小为2785371字节。
提供机构:
ferrazzipietro
原始信息汇总
数据集概述
数据集特征
- sentence:字符串类型
- entities:列表类型,包含以下子特征:
- id:字符串类型
- offsets:整数序列类型(int64)
- role:字符串类型
- semantic_type_id:字符串类型
- text:字符串类型
- type:字符串类型
- original_text:字符串类型
- original_id:字符串类型
- tokens:字符串序列类型
- ner_tags:整数序列类型(int64)
- input_ids:整数序列类型(int32)
- attention_mask:整数序列类型(int8)
- labels:整数序列类型(int64)
- predictions:字符串序列类型
- ground_truth_labels:字符串序列类型
数据集分割
- test:
- 字节数:2785371
- 示例数量:681
数据集大小
- 下载大小:318264字节
- 数据集大小:2785371字节
配置
- config_name:default
- data_files:
- split:test
- path:data/test-*



