DETECT-AI-Dataset
收藏Hugging Face2026-03-14 更新2026-03-16 收录
下载链接:
https://huggingface.co/datasets/anas775/DETECT-AI-Dataset
下载链接
链接失效反馈官方服务:
资源简介:
DETECT-AI 多模态 AI 内容检测数据集是一个用于检测 AI 生成内容的大规模数据集,涵盖文本、图像、视频和音频四种模态,支持包括英语、中文、阿拉伯语等在内的 19 种语言。数据集每月从 19 个全球来源爬取超过 10 亿条经过验证的样本,并通过 8 个专业 AI 检测模型的加权集成进行标注。数据标注分为三类:AI_GENERATED(AI 生成,置信度 ≥ 0.75)、HUMAN(人类创作,置信度 ≤ 0.35)和 UNCERTAIN(不确定,置信度 0.35–0.75)。数据集采用 CC-BY-4.0 许可,允许研究和商业用途。数据组织结构清晰,包含元数据、样本内容和处理日志等,适用于文本分类、图像分类、视频分类和音频分类等多种任务。
创建时间:
2026-03-14



