数据堂—大模型内容安全类文本数据
收藏魔搭社区2026-05-16 更新2024-05-15 收录
下载链接:
https://modelscope.cn/datasets/DatatangBeijing/ChineseLargeLanguageModelcontentsafetyconsiderationstextdata
下载链接
链接失效反馈官方服务:
资源简介:
大模型内容安全类文本数据约50万条,该数据可用于大型语言模型(LLM)训练、chatgpt等任务
Approximately 500,000 content safety-related text data samples for large models. This dataset can be used for training large language models (LLMs), ChatGPT-related tasks and other similar tasks.
提供机构:
maas
创建时间:
2024-05-10
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集包含约50万条大型语言模型内容安全文本数据,涵盖31大类敏感指令和10万条严厉词汇,适用于LLM训练和chatgpt测试任务。数据由专业标注员编写,以txt格式存储,语言为中文。
以上内容由遇见数据集搜集并总结生成



