five

AmazonScience/DocTalk

收藏
Hugging Face2025-07-09 更新2025-07-05 收录
下载链接:
https://hf-mirror.com/datasets/AmazonScience/DocTalk
下载链接
链接失效反馈
官方服务:
资源简介:
DocTalk是一个通过三阶段管道构建的大型合成对话语料库,用于增强大型语言模型(LLM)的对话能力。该语料库包含了730,707个多轮、多主题的信息寻求对话,由相关维基百科文档集群转换而来。

DocTalk is a large-scale synthetic dialogue corpus constructed through a three-stage pipeline to convert clusters of related Wikipedia documents into multi-turn, multi-topic information-seeking conversations for enhancing the conversational capabilities of large language models (LLM).
提供机构:
AmazonScience
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作