ferrazzipietro/unLS_Llama-2-13b-hf_e3c-sentences_NoQuant_32_32_0.05_8_BestF1
收藏Hugging Face2024-07-08 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/ferrazzipietro/unLS_Llama-2-13b-hf_e3c-sentences_NoQuant_32_32_0.05_8_BestF1
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个特征字段,如句子、实体、原始文本等,其中实体字段进一步细分为id、offsets、role等子字段。数据集仅包含一个测试集,测试集的大小为663918字节,包含170个样本。数据集的下载大小为132946字节,总大小为663918字节。
The dataset contains multiple feature fields such as sentence, entities, original text, etc., with the entities field further subdivided into id, offsets, role, etc. The dataset includes only a test set, which is 663918 bytes in size and contains 170 samples. The download size of the dataset is 132946 bytes, and the total size is 663918 bytes.
提供机构:
ferrazzipietro
原始信息汇总
数据集概述
数据集特征
- sentence: 句子文本,数据类型为字符串。
- entities: 实体列表,包含以下字段:
- id: 实体ID,数据类型为字符串。
- offsets: 实体偏移量,数据类型为整数序列。
- role: 实体角色,数据类型为字符串。
- semantic_type_id: 语义类型ID,数据类型为字符串。
- text: 实体文本,数据类型为字符串。
- type: 实体类型,数据类型为字符串。
- original_text: 原始文本,数据类型为字符串。
- original_id: 原始ID,数据类型为字符串。
- tokens: 分词序列,数据类型为字符串序列。
- ner_tags: 命名实体识别标签,数据类型为整数序列。
- input_ids: 输入ID序列,数据类型为32位整数序列。
- attention_mask: 注意力掩码,数据类型为8位整数序列。
- labels: 标签序列,数据类型为整数序列。
- predictions: 预测结果序列,数据类型为字符串序列。
- ground_truth_labels: 真实标签序列,数据类型为字符串序列。
数据集分割
- test: 测试集,包含170个样本,总字节数为663918。
数据集大小
- 下载大小: 132946字节
- 数据集大小: 663918字节
配置
- default: 默认配置,包含测试集文件路径为
data/test-*。



