kimsiun/clinical_trial_eligibility_crietria_recommendation
收藏Hugging Face2023-10-11 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/kimsiun/clinical_trial_eligibility_crietria_recommendation
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含用于论文CReSE: Enhancing Clinical Trial Design via Contrastive Learning and Rephrasing-based and Clinical Relevance-preserving Sentence Embedding的三种主要类型数据:1) 正负EC-标题对,用于训练EC推荐模型;2) 原始-重述EC对,用于开发CReSE模型;3) EC对之间的临床相关性数据,用于评估CReSE模型的EC聚类性能。所有数据均通过ChatGPT生成。
This dataset contains three main types of data for the paper *CReSE: Enhancing Clinical Trial Design via Contrastive Learning, Rephrasing-based and Clinical Relevance-preserving Sentence Embedding*: 1) Positive and negative EC-title pairs for training EC recommendation models; 2) Original-rephrased EC pairs for developing the CReSE model; 3) Clinical relevance data between EC pairs, used to evaluate the EC clustering performance of the CReSE model. All data were generated via ChatGPT.
提供机构:
kimsiun
原始信息汇总
数据集概述
本数据集用于论文 "CReSE: Enhancing Clinical Trial Design via Contrastive Learning and Rephrasing-based and Clinical Relevance-preserving Sentence Embedding"(正在评审中)。数据集包含三种主要类型的数据:
-
正负EC-标题对数据集:
- 该数据集将研究中使用的EC与研究的标题和其他设计信息配对,可用于训练EC推荐模型(二元分类)。
- 根据试验信息的输入类型和试验中EC的数量,有不同的数据集可用。
- 例如:
train_pairs_positive_inputtype_only_title.p:仅使用试验标题作为输入类型收集的正对数据。train_pairs_negative_Ent8_inputtype_title+CTinfo.p:仅使用试验标题和半结构化关键设计因素作为输入类型收集的负对数据,仅适用于通过clinicaltrials.gov报告EC数量为8个或更多的试验。
-
原始-重述EC对数据集:
- 用于开发CReSE模型的原始-重述EC对数据。EC重述使用ChatGPT(gpt-3.5-turbo)进行。
-
EC对之间的临床相关性数据集:
- 用于评估CReSE模型EC聚类性能的不同EC之间的临床相关性数据集。该数据集也使用ChatGPT(gpt-3.5-turbo)创建。
更多具体的数据生成条件和相关提示,请参阅论文。



