ferrazzipietro/unLS_Llama-2-13b-hf_e3c-sentences_NoQuant_16_64_0.01_8_BestF1
收藏Hugging Face2024-07-08 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/ferrazzipietro/unLS_Llama-2-13b-hf_e3c-sentences_NoQuant_16_64_0.01_8_BestF1
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个字段,如句子、实体、原始文本、原始ID、标记、NER标签、输入ID、注意力掩码、标签、预测和真实标签等。数据集仅包含测试集,测试集有170个示例,总大小为663918字节。数据集的下载大小为132973字节。
The dataset includes multiple fields such as sentence, entities, original text, original ID, tokens, NER tags, input IDs, attention mask, labels, predictions, and ground truth labels. The dataset contains only a test set with 170 examples and a total size of 663918 bytes. The download size of the dataset is 132973 bytes.
提供机构:
ferrazzipietro
原始信息汇总
数据集概述
数据集特征
- sentence: 字符串类型,表示句子。
- entities: 列表类型,包含以下子特征:
- id: 字符串类型,表示实体ID。
- offsets: 整数序列类型,表示偏移量。
- role: 字符串类型,表示角色。
- semantic_type_id: 字符串类型,表示语义类型ID。
- text: 字符串类型,表示文本。
- type: 字符串类型,表示类型。
- original_text: 字符串类型,表示原始文本。
- original_id: 字符串类型,表示原始ID。
- tokens: 字符串序列类型,表示分词结果。
- ner_tags: 整数序列类型,表示命名实体识别标签。
- input_ids: 整数序列类型,表示输入ID。
- attention_mask: 整数序列类型,表示注意力掩码。
- labels: 整数序列类型,表示标签。
- predictions: 字符串序列类型,表示预测结果。
- ground_truth_labels: 字符串序列类型,表示真实标签。
数据集分割
- test: 包含170个样本,总字节数为663918。
数据集大小
- 下载大小: 132973字节
- 数据集大小: 663918字节
配置
- default: 包含测试数据文件,路径为
data/test-*。



