five

晴数智慧高质量大模型多轮对话SFT数据集

收藏
OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/MagicHub/LLM-SFT-Dataset
下载链接
链接失效反馈
官方服务:
资源简介:
此数据集包含15万轮中文自然对话句子,由来自中国7个省份 (江苏、四川、山东、山西、北京、广东、海南)的663名说话人贡献,其中男性368人,女性295人。每组对话由两名说话人围绕一个主题展开,历史的对话与当前的内容密切相关。适用于训练大模型多轮对话 (back and forth conversation)、上下文逻辑推理能力。
提供机构:
MagicHub
创建时间:
2023-11-28
二维码
社区交流群
二维码
科研交流群
商业服务