THUOCL
收藏arXiv2025-09-30 收录
下载链接:
https://github.com/thunlp/THUOCL
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为THUOCL,是一个专门用于医学领域的高频中文词汇资源,旨在为实体提取任务编制一份详尽的医学术语列表。该词汇库包含了18,749个医学专业术语。任务的目的是进行实体提取。
Named THUOCL, this dataset is a high-frequency Chinese lexical resource dedicated to the medical domain. It is designed to compile a comprehensive list of medical terms for entity extraction tasks. This lexical repository contains 18,749 specialized medical terms, and the task supported by this resource focuses on entity extraction.
搜集汇总
背景与挑战
背景概述
THUOCL是一个医学领域的高频中文词汇数据集,包含18,749个专业术语,专门用于支持实体提取任务,旨在提供详尽的医学术语列表资源。
以上内容由遇见数据集搜集并总结生成



