five

游戏领域命名实体识别数据集

收藏
魔搭社区2026-04-30 更新2024-05-15 收录
下载链接:
https://modelscope.cn/datasets/iic/game_ner
下载链接
链接失效反馈
官方服务:
资源简介:
# 游戏领域命名实体识别数据集 ## 数据集概述 Game数据集是面向游戏领域的中文命名实体识别数据集。 ### 数据集简介 本数据集包括测试集(279),实体类型包括地址名、书籍名、公司名、游戏名、政府机构名、电影名、人名、机构名、职位名、景点名。 ### 数据集的格式和结构 数据格式采用conll标准,数据分为两列,第一列是输入句中的词划分,第二列是每个词对应的命名实体类型标签。一个具体case的例子如下: ``` 全 O 战 O 开 B-position 发 I-position 商 I-position 新 O 作 O 《 B-game 风 I-game 暴 I-game 骤 I-game 起 I-game 》 I-game 已 O 上 O 市 O ``` ## 数据集版权信息 Creative Commons Attribution 4.0 International。 ## 引用方式 ```bib @inproceedings{jia-etal-2020-entity, title = "Entity Enhanced {BERT} Pre-training for {C}hinese {NER}", author = "Jia, Chen and Shi, Yuefeng and Yang, Qinrong and Zhang, Yue", booktitle = "Proceedings of the 2020 Conference on Empirical Methods in Natural Language Processing (EMNLP)", month = nov, year = "2020", address = "Online", publisher = "Association for Computational Linguistics", url = "https://aclanthology.org/2020.emnlp-main.518", doi = "10.18653/v1/2020.emnlp-main.518", pages = "6384--6396", } ```

# 游戏领域命名实体识别数据集 ## 数据集概述 Game数据集系面向游戏领域的中文命名实体识别专用数据集。 ### 数据集简介 本数据集包含测试集(样本量279),涵盖的实体类型包括地址名、书籍名、公司名、游戏名、政府机构名、电影名、人名、机构名、职位名及景点名。 ### 数据集格式与结构 本数据集采用CoNLL标准(Conference on Computational Natural Language Learning)格式,数据以两列形式组织:第一列为输入语句的分词结果,第二列为对应每个分词的命名实体类型标签。以下为一则具体示例: 全 O 战 O 开 B-position 发 I-position 商 I-position 新 O 作 O 《 B-game 风 I-game 暴 I-game 骤 I-game 起 I-game 》 I-game 已 O 上 O 市 O ## 数据集版权信息 本数据集采用知识共享署名4.0国际许可协议(Creative Commons Attribution 4.0 International)发布。 ## 引用方式 bib @inproceedings{jia-etal-2020-entity, title = "面向中文命名实体识别的实体增强型BERT预训练", author = "Jia, Chen and Shi, Yuefeng and Yang, Qinrong and Zhang, Yue", booktitle = "2020年自然语言处理经验方法会议(EMNLP)论文集", month = nov, year = "2020", address = "线上", publisher = "国际计算语言学协会", url = "https://aclanthology.org/2020.emnlp-main.518", doi = "10.18653/v1/2020.emnlp-main.518", pages = "6384--6396", }
提供机构:
maas
创建时间:
2022-10-25
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集是专门针对游戏领域的中文命名实体识别数据集,包含10种实体类型和279条测试数据,采用CoNLL标准格式标注。数据集专注于游戏领域的特定实体识别任务,适用于中文NLP相关研究。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务