NobodyExistsOnTheInternet/PuffedLIMAsub4000
收藏Hugging Face2023-08-28 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/NobodyExistsOnTheInternet/PuffedLIMAsub4000
下载链接
链接失效反馈官方服务:
资源简介:
PuffedConvo数据集是Puffin和ConvoEvol的混合体,包含了11.6k个指令对。该数据集已经通过LLAMA-2-13b-HF编码器进行了过滤,限制在4000个token以内。
The PuffedConvo Dataset is a hybrid of Puffin and ConvoEvol, consisting of 11.6k instruction pairs. This dataset has been filtered using the LLAMA-2-13b-HF encoder, with a maximum token limit of 4000.
提供机构:
NobodyExistsOnTheInternet
原始信息汇总
数据集概述
数据集名称
- PuffedConvo
数据集组成
- 由Puffin和ConvoEvol混合而成
数据量
- 包含11.6k个指令对
过滤条件
- 针对LLAMA-2-13b-HF编码器进行了4000个tokens的过滤



