xi0v/UltraInteract-SFT-Instruct

Name: xi0v/UltraInteract-SFT-Instruct
Creator: xi0v
Published: 2024-04-11 17:34:26
License: 暂无描述

Hugging Face2024-04-11 更新2024-06-12 收录

下载链接：

https://hf-mirror.com/datasets/xi0v/UltraInteract-SFT-Instruct

下载链接

链接失效反馈

官方服务：

资源简介：

UltraInteract是一个大规模、高质量的对齐数据集，专门设计用于复杂推理任务。每个指令都包含一个偏好树，该树由多样化的规划策略的推理链、与环境的多轮交互轨迹以及用于偏好学习的成对数据组成。数据集的结构包括指令作为根节点，每个动作作为节点，以及从根到叶的路径作为轨迹。数据集的统计信息显示，它包含86k条指令、286k个正确答案和219k对数据。

提供机构：

xi0v

原始信息汇总

数据集概述

基本信息

语言: 英语
数据集大小: 687238字节
训练集大小: 288579个示例
下载大小: 687238字节
数据集类别: 100K<n<1M字节

数据集结构

UltraInteract 是一个专为复杂推理任务设计的大规模高质量数据集。
每个指令包含一个偏好树，包括：
- 推理链，采用统一的格式展示多样的规划策略
- 多轮交互轨迹，涉及环境交互和批评
- 成对数据，用于偏好学习

数据集用途

用于支持SFT（Supervised Fine-Tuning）和偏好学习。

数据集统计

包含86k指令，286k正确答案，219k成对数据。

5,000+

优质数据集

54 个

任务类型

进入经典数据集