koutch/stackoverflow_python
收藏Hugging Face2023-03-27 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/koutch/stackoverflow_python
下载链接
链接失效反馈官方服务:
资源简介:
该数据集最初来源于Kaggle,原本分为三个CSV文件(Questions、Answers和Tags),现已合并为一个表格。每行对应一个问答对及其相关标签。数据集包含2008年8月2日至2016年10月19日期间提出的所有问题。该数据集适用于开放域问答任务,并遵循CC-BY-SA 3.0许可。
提供机构:
koutch
原始信息汇总
数据集概述
数据集名称
stackoverflow_python
数据集来源
原始数据来自kaggle,由三个CSV文件(Questions, Answers, Tags)合并成一个表。
数据集内容
每行数据对应一个(问题-答案)对及其相关标签。数据包含2008年8月2日至2016年10月19日期间的所有问题。
数据集特征
- title: 字符串类型
- question_id: 整数类型
- question_body: 字符串类型
- question_score: 整数类型
- question_date: 字符串类型
- answer_id: 整数类型
- answer_body: 字符串类型
- answer_score: 整数类型
- answer_date: 字符串类型
- tags: 字符串序列类型
数据集大小
- 训练集大小:987122个样本,占用2142466142字节
- 下载大小:829547986字节
- 数据集总大小:2142466142字节
语言
- 英语(en)
任务类别
- 问答(question-answering)
数据集大小类别
- 100K<n<1M
许可证
所有Stack Overflow用户贡献内容均根据CC-BY-SA 3.0许可证授权,需提供归属。



