俄罗斯药物反应语料库 (RUDREC)
收藏arXiv2020-04-08 更新2024-06-21 收录
下载链接:
https://github.com/cimm-kzn/RuDReC
下载链接
链接失效反馈官方服务:
资源简介:
俄罗斯药物反应语料库(RUDREC)是由喀山联邦大学创建的一个新的部分标注语料库,旨在从俄语消费者评论中检测与健康相关的命名实体和药品的有效性。该语料库包含两部分:原始部分包括从各种互联网来源收集的140万条与健康相关的用户生成文本,标注部分包含500条关于药物治疗的消费者评论,涉及药物和疾病相关信息。数据集的创建过程涉及从公开可访问的互联网资源中收集数据,并进行手动标注。RUDREC的应用领域包括促进文本挖掘方法的发展,以分析和比较患者健康状况和不良药物反应报告,以及与传统来源如药物标签的比较。
The Russian Drug Reaction Corpus (RUDREC) is a new partially annotated corpus developed by Kazan Federal University, aimed at identifying health-related named entities and medication efficacy from Russian consumer reviews. This corpus consists of two segments: the raw segment includes 1.4 million health-related user-generated texts collected from diverse internet sources, while the annotated segment contains 500 consumer reviews on pharmacotherapy that cover medication and disease-related information. The development of this dataset involves collecting data from publicly accessible internet resources and performing manual annotation. Application scenarios of RUDREC include advancing the development of text mining methods for analyzing patient health status and adverse drug reaction reports, as well as comparing these analytical results with traditional sources such as drug labels.
提供机构:
喀山联邦大学
创建时间:
2020-04-08
搜集汇总
背景与挑战
背景概述
俄罗斯药物反应语料库(RUDREC)是一个由喀山联邦大学创建的部分标注语料库,旨在从俄语消费者评论中提取健康相关命名实体和药品有效性信息。数据集包括140万条原始健康相关文本和500条标注的药物治疗评论,用于支持文本挖掘分析患者健康状况和不良药物反应,并与传统药物标签进行比较。
以上内容由遇见数据集搜集并总结生成



