ruanchaves/hashset_manual

Name: ruanchaves/hashset_manual
Creator: ruanchaves
Published: 2022-10-20 19:13:18
License: 暂无描述

Hugging Face2022-10-20 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/ruanchaves/hashset_manual

下载链接

链接失效反馈

官方服务：

资源简介：

HashSet Manual是一个新的数据集，包含1.9k手动标注和3.3M松散监督的推文，用于测试标签分割模型的效率。数据集支持印地语和英语，主要用于命名实体识别和结构预测任务。每个数据实例包含标签、分割、命名实体标注、是否包含印地语和英语混合标记、是否包含非英语标记等信息。

提供机构：

ruanchaves

原始信息汇总

字段一致性: 所有标签分割和标识分割数据集共享基本字段: hashtag 和 segmentation 或 identifier 和 segmentation。
分割规则: 在字母数字字符和任何特殊字符序列之间始终有空格。
命名实体和其他分类任务的标注: 在spans字段中提供。

5,000+

优质数据集

54 个

任务类型

进入经典数据集