five

HANA 中文闲聊对话数据集

收藏
魔搭社区2026-05-24 更新2026-05-03 收录
下载链接:
https://modelscope.cn/datasets/xuanxixue/HANA
下载链接
链接失效反馈
官方服务:
资源简介:
数据集概述:这是一个高质量的中文闲聊对话数据集,包含10万条多场景中文对话数据。数据集通过模板化生成,覆盖了多种日常交流场景,适合用于对话模型的训练和评估。数据规模:总对话数:10万条,文件数量100 个批次文件,单批大小:约 1000 条对话/批,文件格式:JSON 格式

Dataset Overview: This is a high-quality Chinese casual conversation dataset containing 100,000 multi-scenario Chinese dialogue entries. The dataset is generated via templating, covering various daily communication scenarios, and is suitable for the training and evaluation of conversation models. Dataset Scale: Total number of dialogues: 100,000 entries; Number of files: 100 batch files; Batch size: approximately 1,000 dialogues per batch; File format: JSON format.
提供机构:
maas
创建时间:
2026-03-26
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
HANA 中文闲聊对话数据集是一个由WorkBuddy AI生成的AI数据集,包含10万条JSON格式的对话条目,覆盖日常生活、工作学习等8个话题类别,每段对话有3-6轮。该数据集由玄曦雪创建,南京绮梦星绘科技有限公司出品,适用于对话系统训练和NLP研究等场景。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务