Synadapt/Orpo_Split_Turns_v2_clean_meta
收藏Hugging Face2024-06-28 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/Synadapt/Orpo_Split_Turns_v2_clean_meta
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个回合的对话数据,每个回合包括系统提示、领域、复杂性、对话文本及其标记、元数据和验证信息。数据集主要用于训练模型,包含20个示例,总大小为243310字节。
This dataset contains multi-turn dialogue data, including system prompts, domains, complexity, dialogue texts and their tokens, metadata, and validation information. The dataset is primarily used for training models, containing 20 examples with a total size of 243310 bytes.
提供机构:
Synadapt
原始信息汇总
数据集概述
数据集特征
- System_Prompt: 字符串类型
- system_prompt_tokens: 字符串类型
- Domain: 字符串类型
- Complexity: 字符串类型
- chosen_turn_1_text 至 chosen_turn_17_text: 字符串类型
- chosen_turn_1_tokens 至 chosen_turn_17_tokens: 字符串类型
- rejected_turn_1_text 至 rejected_turn_17_text: 字符串类型
- rejected_turn_1_tokens 至 rejected_turn_17_tokens: 字符串类型
- chosen_turn_1_text_metadata_user 至 chosen_turn_17_text_metadata_user: 字符串类型
- chosen_turn_1_text_metadata_assistant 至 chosen_turn_17_text_metadata_assistant: 字符串类型
- chosen_turn_1_text_validation_user 至 chosen_turn_17_text_validation_user: 字符串类型
- chosen_turn_1_text_validation_assistant 至 chosen_turn_17_text_validation_assistant: 字符串类型
数据集分割
- train: 包含20个样本,占用243310字节
数据集大小
- 下载大小: 274615字节
- 数据集大小: 243310字节
配置
- config_name: default
- data_files:
- split: train
- path: data/train-*
- data_files:



