mgp123/datascience-stackexchange-with-similar-questions
收藏Hugging Face2024-03-06 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/mgp123/datascience-stackexchange-with-similar-questions
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是heblackcat102/datascience-stackexchange-posts的过滤版本,仅包含与“数据科学”相关的答案,并且按问题-答案-相似问题-相似答案进行配对。
该数据集是heblackcat102/datascience-stackexchange-posts的过滤版本,仅包含与“数据科学”相关的答案,并且按问题-答案-相似问题-相似答案进行配对。
提供机构:
mgp123
原始信息汇总
数据集概述
数据特征
- Id: 字符串类型
- PostTypeId: 字符串类型
- AcceptedAnswerId: 字符串类型
- ParentId: 字符串类型
- Score: 字符串类型
- ViewCount: 字符串类型
- Body: 字符串类型
- Title: 字符串类型
- ContentLicense: 字符串类型
- FavoriteCount: 字符串类型
- CreationDate: 字符串类型
- LastActivityDate: 字符串类型
- LastEditDate: 字符串类型
- LastEditorUserId: 字符串类型
- OwnerUserId: 字符串类型
- Tags: 字符串序列
- Answer: 字符串类型
- SimilarQuestion: 字符串类型
- SimilarQuestionAnswer: 字符串类型
数据分割
- train: 包含9172个样本,占用32869719字节
数据集大小
- 下载大小: 17840780字节
- 数据集大小: 32869719字节
配置
- default: 包含训练数据文件,路径为
data/train-*



