five

koutch/stackoverflow_python

收藏
Hugging Face2023-03-27 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/koutch/stackoverflow_python
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集最初来源于Kaggle,原本分为三个CSV文件(Questions、Answers和Tags),现已合并为一个表格。每行对应一个问答对及其相关标签。数据集包含2008年8月2日至2016年10月19日期间提出的所有问题。该数据集适用于开放域问答任务,并遵循CC-BY-SA 3.0许可。
提供机构:
koutch
原始信息汇总

数据集概述

数据集名称

stackoverflow_python

数据集来源

原始数据来自kaggle,由三个CSV文件(Questions, Answers, Tags)合并成一个表。

数据集内容

每行数据对应一个(问题-答案)对及其相关标签。数据包含2008年8月2日至2016年10月19日期间的所有问题。

数据集特征

  • title: 字符串类型
  • question_id: 整数类型
  • question_body: 字符串类型
  • question_score: 整数类型
  • question_date: 字符串类型
  • answer_id: 整数类型
  • answer_body: 字符串类型
  • answer_score: 整数类型
  • answer_date: 字符串类型
  • tags: 字符串序列类型

数据集大小

  • 训练集大小:987122个样本,占用2142466142字节
  • 下载大小:829547986字节
  • 数据集总大小:2142466142字节

语言

  • 英语(en)

任务类别

  • 问答(question-answering)

数据集大小类别

  • 100K<n<1M

许可证

所有Stack Overflow用户贡献内容均根据CC-BY-SA 3.0许可证授权,需提供归属。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作