five

Medical Artificial Intelligence text Detection in Multilingual settings (MedAID-ML)

收藏
DataCite Commons2025-05-15 更新2025-06-14 收录
下载链接:
https://digital.csic.es/handle/10261/389309
下载链接
链接失效反馈
官方服务:
资源简介:
This dataset was created by gathering human-authored corpora from several public health sites and generating additional data via three different LLMs: GPT-4o, Mistral-7B and Llama3-1. We included texts in English, Spanish, German and French data from the biomedical domain. The current version gathers 50% AI-generated and 50% human-written texts. The following are the data we used:

本数据集通过从多个公共卫生网站收集人类撰写的语料库,并借助三种不同的大语言模型(LLM)生成补充数据构建而成:GPT-4o、Mistral-7B和Llama3-1。我们纳入了生物医学领域下英语、西班牙语、德语和法语的文本数据。当前版本的数据集包含50%的AI生成文本和50%的人类撰写文本。我们使用的数据如下:
提供机构:
DIGITAL.CSIC
创建时间:
2025-05-15
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作