CEIA-RL/Nemotron-SFT-Safety-pt-BR-Cleaned
收藏Hugging Face2026-04-02 更新2026-04-12 收录
下载链接:
https://hf-mirror.com/datasets/CEIA-RL/Nemotron-SFT-Safety-pt-BR-Cleaned
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: uuid
dtype: string
- name: prompt
list:
- name: content
dtype: string
- name: role
dtype: string
splits:
- name: train
num_bytes: 25565299
num_examples: 40630
- name: test
num_bytes: 2887840
num_examples: 4515
download_size: 28219411
dataset_size: 28453139
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: test
path: data/test-*
---
数据集信息:
特征字段:
- 字段名: uuid(通用唯一标识符,Universally Unique Identifier)
数据类型: 字符串
- 字段名: prompt(提示,Prompt)
数据类型: 列表,列表元素为结构体,包含以下子字段:
- 子字段名: content
数据类型: 字符串
- 子字段名: role
数据类型: 字符串
数据划分:
- 划分名称: train(训练集)
字节数: 25565299
样本数: 40630
- 划分名称: test(测试集)
字节数: 2887840
样本数: 4515
下载总大小: 28219411
数据集总大小: 28453139
配置项:
- 配置名称: default(默认配置)
数据文件:
- 划分集: train
路径: data/train-*
- 划分集: test
路径: data/test-*
提供机构:
CEIA-RL



