five

Mxode/CSDN-Community-C-Language-3years

收藏
Hugging Face2023-10-03 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Mxode/CSDN-Community-C-Language-3years
下载链接
链接失效反馈
官方服务:
资源简介:
--- license: lgpl task_categories: - question-answering - conversational - text-generation language: - zh tags: - code size_categories: - 1K<n<10K --- CSDN - C 语言社区 **2020.10.2 ~ 2023.10.2** 的问答数据,未包含图片,仅有文本内容。 共 **2380** 条,数据已经经过**初步清洗和脱敏**,去除了所有 0 回复的贴子 & 机器人回复的贴子。为了方便不同使用目的,按照回复盖楼的格式对数据进行了组织,一个样例(展开后)如下: ```json { "question": "刚学C语言,为什么这个代码运行不了呢", "poster": "user-0", "comments": [ { "cid": "2", "user": "user-2", "content": "intunsigned intlong longunsigned long long统统容纳不下29的阶乘,早就溢出了。", "referer": "user-0" }, { "cid": "3", "user": "user-3", "content": "#include <stdio.h> #include <math.h> int main(void) { int i = 1; long long sum = 1; // 使用 long long 类型来存储阶乘结果 int x; printf(\"请输入一个非负整数: \"); if (scanf(\"%d\", &x) != 1 || x < 0) { printf(\"输入无效,请输入一个非负整数。\\n\"); return 1; // 返回错误码 } while (i <= x) { sum *= i; i++; } printf(\"%d 的阶乘是 %lld\\n\", x, sum); return 0; }", "referer": "user-0" } ] } ``` `user` 和 `referer` 做了脱敏映射,但保留了回复的逻辑关系(即保留了回复楼主 & 楼中楼回复的逻辑关系)。 `question` 和 `comment` 都按照单行形式进行了组织,无需额外处理。 由于部分回答较长,出于可能的长文需要,因此没有对数据进行修剪,数据具体的分位点如下,请按需修剪: ``` question comments count 2380.000000 2380.000000 mean 22.074370 1528.050840 std 14.986499 2608.022392 min 4.000000 69.000000 10% 7.900000 160.900000 20% 12.000000 235.800000 30% 14.000000 342.000000 40% 16.000000 469.000000 50% 18.000000 648.500000 60% 21.000000 889.000000 70% 25.000000 1234.300000 75% 27.000000 1542.500000 80% 30.000000 1990.400000 85% 34.000000 2665.800000 90% 40.000000 3810.800000 95% 51.000000 6008.050000 max 130.000000 30606.000000 ```
提供机构:
Mxode
原始信息汇总

数据集概述

基本信息

  • 许可证:lgpl
  • 任务类别
    • 问答
    • 对话
    • 文本生成
  • 语言:中文
  • 标签:代码
  • 数据量:1K<n<10K

数据描述

  • 时间范围:2020.10.2 ~ 2023.10.2
  • 数据条数:2380条
  • 数据格式:仅文本内容,未包含图片
  • 数据处理
    • 已进行初步清洗和脱敏
    • 去除了所有0回复的贴子和机器人回复的贴子
    • 按照回复盖楼的格式组织

数据样例

json { "question": "刚学C语言,为什么这个代码运行不了呢", "poster": "user-0", "comments": [ { "cid": "2", "user": "user-2", "content": "intunsigned intlong longunsigned long long统统容纳不下29的阶乘,早就溢出了。", "referer": "user-0" }, { "cid": "3", "user": "user-3", "content": "#include <stdio.h> #include <math.h> int main(void) { int i = 1; long long sum = 1; // 使用 long long 类型来存储阶乘结果 int x; printf("请输入一个非负整数: "); if (scanf("%d", &x) != 1 || x < 0) { printf("输入无效,请输入一个非负整数。\n"); return 1; // 返回错误码 } while (i <= x) { sum *= i; i++; } printf("%d 的阶乘是 %lld\n", x, sum); return 0; }", "referer": "user-0" } ] }

数据字段说明

  • userreferer 进行了脱敏映射,保留了回复的逻辑关系
  • questioncomment 都按照单行形式组织,无需额外处理

数据统计信息

      question      comments

count 2380.000000 2380.000000 mean 22.074370 1528.050840 std 14.986499 2608.022392 min 4.000000 69.000000 10% 7.900000 160.900000 20% 12.000000 235.800000 30% 14.000000 342.000000 40% 16.000000 469.000000 50% 18.000000 648.500000 60% 21.000000 889.000000 70% 25.000000 1234.300000 75% 27.000000 1542.500000 80% 30.000000 1990.400000 85% 34.000000 2665.800000 90% 40.000000 3810.800000 95% 51.000000 6008.050000 max 130.000000 30606.000000

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作