asus-aics/cas
收藏数据集卡片 for CAS
数据集描述
- 主页: https://clementdalloux.fr/?page_id=28
- Pubmed: False
- 公开: False
- 任务: TEXT_CLASSIFICATION
我们手动标注了两个来自生物医学领域的语料库。ESSAI 语料库包含法语的临床试验协议,主要来自国家癌症研究所。典型的协议包括两部分:试验的总结,指明试验的目的和应用的方法;以及试验的详细描述,包括纳入和排除标准。CAS 语料库包含在科学文献和培训材料中发表的临床病例。它们发表在来自法语国家的不同期刊中(法国、比利时、瑞士、加拿大、非洲国家、热带国家),并涉及各种医学专业(心脏病学、泌尿学、肿瘤学、妇产科、肺病学、胃肠病学)。临床病例的目的是描述患者的临床情况。因此,其内容接近临床叙述(描述诊断、治疗或程序、演变、家族史、预期受众等)。在临床病例中,否定经常用于描述患者的体征、症状和诊断。推测也存在,但较少见。
此版本仅包含标注的 CAS 语料库。
引用信息
@inproceedings{grabar-etal-2018-cas, title = {{CAS}: {F}rench Corpus with Clinical Cases}, author = {Grabar, Natalia and Claveau, Vincent and Dalloux, Cl{e}ment}, year = 2018, month = oct, booktitle = { Proceedings of the Ninth International Workshop on Health Text Mining and Information Analysis }, publisher = {Association for Computational Linguistics}, address = {Brussels, Belgium}, pages = {122--128}, doi = {10.18653/v1/W18-5614}, url = {https://aclanthology.org/W18-5614}, abstract = { 文本语料库对于各种NLP应用极其重要,因为它们提供了创建、设置和测试这些应用及其相应工具所需的信息。它们对于设计可靠的方法和可重复的结果也至关重要。然而,在某些领域,如医学领域,由于保密或伦理原因,访问代表这些领域生产的文本数据变得复杂甚至不可能。我们提出了CAS语料库,该语料库包含在法语发表的科学文献中报告的临床病例。我们描述了这个目前包含超过397,000个词出现的语料库以及现有的语言和语义标注。 } }



