five

zirui3/zhihu_qa_oa_instructions

收藏
Hugging Face2023-05-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/zirui3/zhihu_qa_oa_instructions
下载链接
链接失效反馈
官方服务:
资源简介:
`zhihu_qa`数据集包含来自知乎的3,000个问题和230,000个答案,这些问题涵盖了10个热门话题,包括文化、教育、艺术、大学、互联网、心理、科技、健康、职业发展和生活方式。数据格式遵循`Open-Assistant`的格式。

`zhihu_qa`数据集包含来自知乎的3,000个问题和230,000个答案,这些问题涵盖了10个热门话题,包括文化、教育、艺术、大学、互联网、心理、科技、健康、职业发展和生活方式。数据格式遵循`Open-Assistant`的格式。
提供机构:
zirui3
原始信息汇总

数据集概述

数据集名称

zhihu_qa

数据集内容

  • 问题数量:3,000个问题
  • 回答数量:230,000个回答
  • 来源:zhihu.com

数据集结构

数据遵循Open-Assistant的格式,每个样本包含以下字段:

  • INSTRUCTION:问题描述
  • RESPONSE:回答内容
  • SOURCE:数据来源标识
  • meta:元数据,包括问题ID、回答ID、回答类型和标签

数据集主题

数据集涵盖以下10个热门主题:

  • 文化
  • 教育
  • 艺术
  • 大学
  • 互联网
  • 心理
  • 科技
  • 健康
  • 职业发展
  • 生活方式

许可证

本数据集遵循cc-by-4.0许可证。

搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集是一个来自知乎的问答数据集,包含约225K条问题与回答,覆盖10个热门话题。数据以JSON格式存储,每条记录包含问题、回答、来源及元数据,适用于自然语言处理任务如问答系统训练。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作