medqa-cot-llama31
收藏数据集卡片:medqa-cot-llama31
概述
合成增强的MedQA数据集响应,用于训练Aloe-Beta模型。
数据集详情
数据集描述
通过利用Llama-3.1-70B-Instruct生成Chain of Thought(CoT)答案,增强MedQA数据集的训练分割答案质量。创建了自定义提示和手工制作的少样本示例。对于多选答案,模型被要求重新表述并解释问题,然后根据问题解释每个选项,最后总结这些解释以得出最终解决方案。在合成数据生成过程中,模型还被提供了解决方案和参考答案。在模型未能生成正确响应的情况下,会重新生成解决方案,直到生成正确响应。更多细节可在论文中找到。
- 创建者: Jordi Bayarri Planas
- 语言: 英语
- 许可证: Apache 2.0
数据集来源
数据集创建
创建理由
该数据集旨在提供一个基于MedQA的高质量、易于使用的指令调优数据集。
引用
BibTeX:
@misc{gururajan2024aloe, title={Aloe: A Family of Fine-tuned Open Healthcare LLMs}, author={Ashwin Kumar Gururajan and Enrique Lopez-Cuena and Jordi Bayarri-Planas and Adrian Tormos and Daniel Hinjos and Pablo Bernabeu-Perez and Anna Arias-Duart and Pablo Agustin Martin-Torres and Lucia Urcelay-Ganzabal and Marta Gonzalez-Mallo and Sergio Alvarez-Napagao and Eduard Ayguadé-Parra and Ulises Cortés Dario Garcia-Gasulla}, year={2024}, eprint={2405.01886}, archivePrefix={arXiv}, primaryClass={cs.CL} }
@article{jin2020disease, title={What Disease does this Patient Have? A Large-scale Open Domain Question Answering Dataset from Medical Exams}, author={Jin, Di and Pan, Eileen and Oufattole, Nassim and Weng, Wei-Hung and Fang, Hanyi and Szolovits, Peter}, journal={arXiv preprint arXiv:2009.13081}, year={2020} }
数据集卡片作者
数据集卡片联系




