five

TweetNERD

收藏
arXiv2022-10-15 更新2024-06-21 收录
下载链接:
https://doi.org/10.5281/zenodo.6617192
下载链接
链接失效反馈
官方服务:
资源简介:
TweetNERD是由Twitter, Inc.的研究人员创建的一个大规模数据集,包含了从2010年到2021年的超过340,000条推文。该数据集旨在为推文中的命名实体识别和消歧(NERD)任务提供基准测试。TweetNERD不仅数据量庞大,而且时间跨度广泛,覆盖了多个年份,这有助于研究人员评估模型在不同时间段的表现。数据集中的每条推文都已标注了实体提及,并链接到Wikidata中的实体,这为研究提供了丰富的资源。TweetNERD的应用领域包括信息检索、问答系统、事件检测等自然语言处理(NLP)应用,旨在解决社交媒体文本中的实体识别和链接问题。
提供机构:
Twitter, Inc.
创建时间:
2022-10-15
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作