CNERTA中文多模态命名实体识别数据集

千言数据集2024-05-15 收录

下载链接：

https://www.luge.ai/#/luge/dataDetail?id=42

下载链接

链接失效反馈

官方服务：

资源简介：

CNERTA数据集是一个语音文本双模态中文命名实体识别数据集，数据集包含了4万多个自然语言句子，是目前最大的多模态命名实体识别数据集以及中文嵌套命名实体识别数据集。数据集中的句子覆盖了体育、时事政治、新闻、金融等多个领域。

The CNERTA dataset is a speech-text bimodal Chinese named entity recognition dataset. It contains over 40,000 natural language sentences, making it currently the largest multimodal named entity recognition dataset as well as the largest Chinese nested named entity recognition dataset. The sentences in the dataset cover multiple domains including sports, current affairs and politics, news, finance and other fields.

提供机构：

中国科学院自动化研究所中国科学院自动化研究所中国科学院自动化研究所中国科学院自动化研究所中国科学院自动化研究所

搜集汇总

数据集介绍

以上内容由遇见数据集搜集并总结生成