five

pierretassel/conll2003_text_language_tagged_text

收藏
Hugging Face2024-11-24 更新2024-12-14 收录
下载链接:
https://hf-mirror.com/datasets/pierretassel/conll2003_text_language_tagged_text
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含多个自然语言处理任务相关的特征,如id、tokens、pos_tags(词性标注)、chunk_tags(短语标注)、ner_tags(命名实体识别)等。数据集分为训练集、验证集和测试集,分别包含14041、3250和3453个样本。这些特征可以用于训练和评估自然语言处理模型。

This dataset contains multiple features related to natural language processing tasks, such as id, tokens, pos_tags (part-of-speech tagging), chunk_tags (phrase tagging), ner_tags (named entity recognition), etc. The dataset is divided into training, validation, and test sets, containing 14041, 3250, and 3453 samples respectively. These features can be used to train and evaluate natural language processing models.
提供机构:
pierretassel
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作