five

Broad Twitter Corpus

收藏
OpenDataLab2026-05-24 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/Broad_Twitter_Corpus
下载链接
链接失效反馈
官方服务:
资源简介:
广泛的 Twitter 语料库是一个命名实体注释的推文数据集,收集这些数据是为了捕捉时间、空间和社会的多样性。语料库的目标是提供社交媒体中命名实体的代表性示例。它的注解具有很高的一致性和质量,它有大约 12000 个实体注解,类型为 Person、Location 和 Organization。

The broad Twitter corpus is a named entity-annotated tweet dataset compiled to capture temporal, spatial, and social diversity. The core objective of this corpus is to provide representative examples of named entities within social media. Its annotations boast high consistency and quality, containing approximately 12,000 entity annotations categorized into three types: Person, Location, and Organization.
提供机构:
OpenDataLab
创建时间:
2022-06-23
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
Broad Twitter Corpus是一个包含约12000个命名实体注解的推文数据集,实体类型包括人物、地点和组织。该数据集由谢菲尔德大学于2016年发布,旨在为社交媒体中的命名实体识别提供代表性示例。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作