Nexdata/50000_Chinese_Social_Comments_Syntax_Annotation_Data
收藏Hugging Face2024-04-16 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Nexdata/50000_Chinese_Social_Comments_Syntax_Annotation_Data
下载链接
链接失效反馈官方服务:
资源简介:
---
license: cc-by-nc-nd-4.0
---
## Description
50,000 Chinese social comments syntax annotated data. The contents are hot news in 2013. It is annotated with dependency syntax. The contents cover entertainment, economics, technology, fashion, sports, culture and society. The data is stored in xml and can be used for natural language understanding.
For more details, please refer to the link: https://www.nexdata.ai/dataset/85?source=Huggingface
# Specifications
## Data content
Weibo Chinese Syntax Tree Library
## Data size
53,097 Chinese sentences on Weibo
## Annotation policy
Peking University People's Daily Standard, Harbin Institute of Technology Dependency Syntax Notation Specification, Pennsylvania Chinese Tree Library Labeling Specification
## Annotation period
May 2,013
## Storage format
conv
## Language
Chinese
## Data category
Weibo
# Licensing Information
Commercial License
---
许可证:CC BY-NC-ND 4.0
---
## 数据集描述
本数据集包含50,000条中文社交评论句法标注数据,其内容均为2013年的热点新闻,采用依存句法进行标注。数据涵盖娱乐、经济、科技、时尚、体育、文化与社会领域,以XML格式存储,可用于自然语言理解任务。
如需获取更多详情,请访问链接:https://www.nexdata.ai/dataset/85?source=Huggingface
# 规格说明
## 数据内容
微博中文句法树库
## 数据规模
53,097条微博中文语句
## 标注规范
采用北京大学人民日报语料库标准、哈尔滨工业大学依存句法标注规范以及宾夕法尼亚大学中文树库标注规则
## 标注时间
2013年5月
## 存储格式
conv格式
## 语言
中文
## 数据类别
微博数据
# 许可信息
商业许可
提供机构:
Nexdata
原始信息汇总
数据集概述
描述
- 数据集名称:50,000 Chinese social comments syntax annotated data
- 内容概述:包含2013年的热门新闻评论,涵盖娱乐、经济、科技、时尚、体育、文化和社會等多个领域。
- 标注类型:依赖语法标注
- 存储格式:XML
- 用途:自然语言理解
规格
- 数据内容:Weibo Chinese Syntax Tree Library
- 数据大小:53,097个中文句子
- 标注政策:北京大学人民日报标准、哈尔滨工业大学依赖语法标注规范、宾夕法尼亚中文树库标注规范
- 标注时间:2013年5月
- 语言:中文
- 数据类别:微博
许可信息
- 许可证:Commercial License
搜集汇总
数据集介绍

以上内容由遇见数据集搜集并总结生成



