five

DETECT-AI-Dataset

收藏
Hugging Face2026-03-14 更新2026-03-16 收录
下载链接:
https://huggingface.co/datasets/anas775/DETECT-AI-Dataset
下载链接
链接失效反馈
官方服务:
资源简介:
DETECT-AI 多模态 AI 内容检测数据集是一个用于检测 AI 生成内容的大规模数据集,涵盖文本、图像、视频和音频四种模态,支持包括英语、中文、阿拉伯语等在内的 19 种语言。数据集每月从 19 个全球来源爬取超过 10 亿条经过验证的样本,并通过 8 个专业 AI 检测模型的加权集成进行标注。数据标注分为三类:AI_GENERATED(AI 生成,置信度 ≥ 0.75)、HUMAN(人类创作,置信度 ≤ 0.35)和 UNCERTAIN(不确定,置信度 0.35–0.75)。数据集采用 CC-BY-4.0 许可,允许研究和商业用途。数据组织结构清晰,包含元数据、样本内容和处理日志等,适用于文本分类、图像分类、视频分类和音频分类等多种任务。
创建时间:
2026-03-14
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作