five

award40/autogen-discord-qa-20231115

收藏
Hugging Face2023-12-28 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/award40/autogen-discord-qa-20231115
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集来源于Autogen Discord社区,专注于开发基于LLM的多代理系统。它包含了近900个问答对,这些问答对是从社区的大量讨论中精心挑选出来的。数据集的创建过程涉及从数千条交换消息中提取文本块,并使用LLM生成一系列问题和答案,涵盖了多样化的主题、讨论、见解和代码片段。值得注意的是,所有用户名和敏感信息已被移除。该数据集提供了社区集体知识的快照,这些知识可能未在文档中反映。数据集的时间范围截至2023年11月15日。

该数据集来源于Autogen Discord社区,专注于开发基于LLM的多代理系统。它包含了近900个问答对,这些问答对是从社区的大量讨论中精心挑选出来的。数据集的创建过程涉及从数千条交换消息中提取文本块,并使用LLM生成一系列问题和答案,涵盖了多样化的主题、讨论、见解和代码片段。值得注意的是,所有用户名和敏感信息已被移除。该数据集提供了社区集体知识的快照,这些知识可能未在文档中反映。数据集的时间范围截至2023年11月15日。
提供机构:
award40
原始信息汇总

Autogen Discord Chat QA Dataset

数据集描述

该数据集源自Autogen Discord社区,专注于LLM驱动的多代理系统的开发。数据集包含近900个问答(QA)对,这些问答对是从社区的大量讨论中精心挑选出来的。

数据集的创建过程涉及从数千条交换消息中审查文本块。使用LLM生成一系列问题和答案,涵盖了多样的话题、讨论、见解和代码片段。值得注意的是,所有用户名和敏感信息均已去除。

该数据集提供了社区集体知识的快照,这些知识可能未反映在文档中。

预期用途

自然语言处理领域的研究人员、开发人员和爱好者可以利用此数据集进行问答系统开发、语言理解研究等任务。

数据集结构

  • 问答对数量: 887
  • 数据来源: Autogen Discord
  • 时间范围: 对话截至2023年11月15日

许可证

该数据集在Apache-2.0许可证下提供。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作