award40/autogen-discord-qa-20231115
收藏Hugging Face2023-12-28 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/award40/autogen-discord-qa-20231115
下载链接
链接失效反馈官方服务:
资源简介:
该数据集来源于Autogen Discord社区,专注于开发基于LLM的多代理系统。它包含了近900个问答对,这些问答对是从社区的大量讨论中精心挑选出来的。数据集的创建过程涉及从数千条交换消息中提取文本块,并使用LLM生成一系列问题和答案,涵盖了多样化的主题、讨论、见解和代码片段。值得注意的是,所有用户名和敏感信息已被移除。该数据集提供了社区集体知识的快照,这些知识可能未在文档中反映。数据集的时间范围截至2023年11月15日。
该数据集来源于Autogen Discord社区,专注于开发基于LLM的多代理系统。它包含了近900个问答对,这些问答对是从社区的大量讨论中精心挑选出来的。数据集的创建过程涉及从数千条交换消息中提取文本块,并使用LLM生成一系列问题和答案,涵盖了多样化的主题、讨论、见解和代码片段。值得注意的是,所有用户名和敏感信息已被移除。该数据集提供了社区集体知识的快照,这些知识可能未在文档中反映。数据集的时间范围截至2023年11月15日。
提供机构:
award40
原始信息汇总
Autogen Discord Chat QA Dataset
数据集描述
该数据集源自Autogen Discord社区,专注于LLM驱动的多代理系统的开发。数据集包含近900个问答(QA)对,这些问答对是从社区的大量讨论中精心挑选出来的。
数据集的创建过程涉及从数千条交换消息中审查文本块。使用LLM生成一系列问题和答案,涵盖了多样的话题、讨论、见解和代码片段。值得注意的是,所有用户名和敏感信息均已去除。
该数据集提供了社区集体知识的快照,这些知识可能未反映在文档中。
预期用途
自然语言处理领域的研究人员、开发人员和爱好者可以利用此数据集进行问答系统开发、语言理解研究等任务。
数据集结构
- 问答对数量: 887
- 数据来源: Autogen Discord
- 时间范围: 对话截至2023年11月15日
许可证
该数据集在Apache-2.0许可证下提供。



