Temporal Twitter Corpus
收藏阿里云天池2026-05-14 更新2024-03-07 收录
下载链接:
https://tianchi.aliyun.com/dataset/144438
下载链接
链接失效反馈官方服务:
资源简介:
It includes 12,000 tweets annotated for the named entity recognition task. The tweets are uniformly distributed over the years 2014-2019, with 2,000 tweets from each year. The goal is to have a temporally diverse corpus to account for data drift over time when building NER models.
提供机构:
阿里云天池
创建时间:
2023-01-12
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集包含12,000条推文,专门用于命名实体识别任务,推文均匀覆盖2014至2019年,每年2000条,旨在构建一个时间多样化的语料库以应对数据漂移。实体标注类型包括位置、人物和组织,数据以JSON格式提供。
以上内容由遇见数据集搜集并总结生成



