数据堂—大模型内容安全类文本数据

Name: 数据堂—大模型内容安全类文本数据
Creator: maas
Published: 2026-05-16 21:12:42
License: 暂无描述

魔搭社区2026-05-16 更新2024-05-15 收录

下载链接：

https://modelscope.cn/datasets/DatatangBeijing/ChineseLargeLanguageModelcontentsafetyconsiderationstextdata

下载链接

链接失效反馈

官方服务：

资源简介：

大模型内容安全类文本数据约50万条，该数据可用于大型语言模型（LLM）训练、chatgpt等任务

Approximately 500,000 content safety-related text data samples for large models. This dataset can be used for training large language models (LLMs), ChatGPT-related tasks and other similar tasks.

提供机构：

maas

创建时间：

2024-05-10

搜集汇总

数据集介绍

背景与挑战

背景概述

该数据集包含约50万条大型语言模型内容安全文本数据，涵盖31大类敏感指令和10万条严厉词汇，适用于LLM训练和chatgpt测试任务。数据由专业标注员编写，以txt格式存储，语言为中文。

以上内容由遇见数据集搜集并总结生成