ruanchaves/test_stanford

Name: ruanchaves/test_stanford
Creator: ruanchaves
Published: 2022-10-20 19:13:07
License: 暂无描述

Hugging Face2022-10-20 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/ruanchaves/test_stanford

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是由Bansal等人手动标注的斯坦福情感分析数据集，专注于英语语言。数据集包含多个字段，如索引、标签、分割、黄金位置和排名，用于结构预测任务，特别是标签中的单词分割。

提供机构：

ruanchaves

原始信息汇总

数据集概述

数据集描述

数据集总结

名称: Test-Stanford
描述: 手动标注的斯坦福情感分析数据集，由Bansal等人创建。
语言: 英语

数据集结构

数据实例

示例字段:
- index: 数值索引，由Kodali等人标注。
- hashtag: 原始标签。
- segmentation: 标签的金标准分割。
- gold_position: 金标准分割在segmentation字段内的位置。
- rank: 由基线词分割器（分割种子模块）选择的每个候选者的排名。

数据字段

所有标签分割和标识分割数据集具有相同的基字段：hashtag和segmentation或identifier和segmentation。
hashtag和segmentation或identifier和segmentation之间的唯一区别是空格字符。
在任何字母数字字符和任何特殊字符序列（如_，:，~）之间总是有空格。
如果有任何命名实体识别和其他令牌分类任务的注释，它们在spans字段中给出。

数据集创建

注释创建者: 专家生成
语言创建者: 机器生成
许可证: 未知
多语言性: 单语
大小分类: 未知
源数据集: 原始
任务类别: 结构预测
标签: 词分割

引用信息

@misc{bansal2015deep, title={Towards Deep Semantic Analysis Of Hashtags}, author={Piyush Bansal and Romil Bansal and Vasudeva Varma}, year={2015}, eprint={1501.03210}, archivePrefix={arXiv}, primaryClass={cs.IR} }

5,000+

优质数据集

54 个

任务类型

进入经典数据集