five

agentlans/QuixiAI-dolphin-distill

收藏
Hugging Face2025-12-13 更新2025-12-20 收录
下载链接:
https://hf-mirror.com/datasets/agentlans/QuixiAI-dolphin-distill
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个非官方的、经过重新格式化的 QuixiAI/dolphin-distill 数据集版本,主要包含英语指令跟随和对话数据集。主要修改包括:仅保留每行中最长的有效对话(可选系统提示,后跟交替的用户和GPT对话轮次)、删除重复行、编辑掉URL、电子邮件地址、电话号码、API密钥和令牌,并进行洗牌和分块处理。原始数据集的11,625,521行被过滤至2,450,616行。

This is an unofficial, reformatted version of the QuixiAI/dolphin-distill dataset, containing mostly English instruction following and conversation datasets. Major changes include: only kept the longest valid conversation from each row (optional system prompt, followed by alternating user and gpt turns), duplicate rows removed, URLs, e-mail addresses, phone numbers, API keys and tokens redacted, shuffled and split into chunks. This filtered the original 11,625,521 rows into just 2,450,616 rows.
提供机构:
agentlans
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作