d-llm/lmsys-chat-70k

Name: d-llm/lmsys-chat-70k
Creator: d-llm
Published: 2024-06-04 17:26:21
License: 暂无描述

Hugging Face2024-06-04 更新2024-06-12 收录

下载链接：

https://hf-mirror.com/datasets/d-llm/lmsys-chat-70k

下载链接

链接失效反馈

官方服务：

资源简介：

--- dataset_info: features: - name: prompt dtype: string - name: response dtype: string - name: score struct: - name: categories struct: - name: harassment dtype: bool - name: harassment/threatening dtype: bool - name: hate dtype: bool - name: hate/threatening dtype: bool - name: self-harm dtype: bool - name: self-harm/instructions dtype: bool - name: self-harm/intent dtype: bool - name: sexual dtype: bool - name: sexual/minors dtype: bool - name: violence dtype: bool - name: violence/graphic dtype: bool - name: category_scores struct: - name: harassment dtype: float64 - name: harassment/threatening dtype: float64 - name: hate dtype: float64 - name: hate/threatening dtype: float64 - name: self-harm dtype: float64 - name: self-harm/instructions dtype: float64 - name: self-harm/intent dtype: float64 - name: sexual dtype: float64 - name: sexual/minors dtype: float64 - name: violence dtype: float64 - name: violence/graphic dtype: float64 - name: flagged dtype: bool splits: - name: train num_bytes: 42899995 num_examples: 29426 download_size: 23086216 dataset_size: 42899995 configs: - config_name: default data_files: - split: train path: data/train-* ---

提供机构：

d-llm

原始信息汇总

数据集概述

数据集特征

prompt: 数据类型为字符串。
response: 数据类型为字符串。
score: 结构化数据，包含以下子特征：
- categories: 包含多个子特征，均为布尔类型，具体包括：
  - harassment
  - harassment/threatening
  - hate
  - hate/threatening
  - self-harm
  - self-harm/instructions
  - self-harm/intent
  - sexual
  - sexual/minors
  - violence
  - violence/graphic
- category_scores: 包含多个子特征，均为浮点数类型（float64），具体包括：
  - harassment
  - harassment/threatening
  - hate
  - hate/threatening
  - self-harm
  - self-harm/instructions
  - self-harm/intent
  - sexual
  - sexual/minors
  - violence
  - violence/graphic
- flagged: 数据类型为布尔类型。

数据集分割

train:
- 数据大小: 42,899,995 字节
- 示例数量: 29,426

数据集大小

下载大小: 23,086,216 字节
数据集大小: 42,899,995 字节

配置信息

config_name: default
data_files:
- split: train
- path: data/train-*

5,000+

优质数据集

54 个

任务类型

进入经典数据集