Mxode/CSDN-Community-C-Language-3years
收藏数据集概述
基本信息
- 许可证:lgpl
- 任务类别:
- 问答
- 对话
- 文本生成
- 语言:中文
- 标签:代码
- 数据量:1K<n<10K
数据描述
- 时间范围:2020.10.2 ~ 2023.10.2
- 数据条数:2380条
- 数据格式:仅文本内容,未包含图片
- 数据处理:
- 已进行初步清洗和脱敏
- 去除了所有0回复的贴子和机器人回复的贴子
- 按照回复盖楼的格式组织
数据样例
json { "question": "刚学C语言,为什么这个代码运行不了呢", "poster": "user-0", "comments": [ { "cid": "2", "user": "user-2", "content": "intunsigned intlong longunsigned long long统统容纳不下29的阶乘,早就溢出了。", "referer": "user-0" }, { "cid": "3", "user": "user-3", "content": "#include <stdio.h> #include <math.h> int main(void) { int i = 1; long long sum = 1; // 使用 long long 类型来存储阶乘结果 int x; printf("请输入一个非负整数: "); if (scanf("%d", &x) != 1 || x < 0) { printf("输入无效,请输入一个非负整数。\n"); return 1; // 返回错误码 } while (i <= x) { sum *= i; i++; } printf("%d 的阶乘是 %lld\n", x, sum); return 0; }", "referer": "user-0" } ] }
数据字段说明
user和referer进行了脱敏映射,保留了回复的逻辑关系question和comment都按照单行形式组织,无需额外处理
数据统计信息
question comments
count 2380.000000 2380.000000 mean 22.074370 1528.050840 std 14.986499 2608.022392 min 4.000000 69.000000 10% 7.900000 160.900000 20% 12.000000 235.800000 30% 14.000000 342.000000 40% 16.000000 469.000000 50% 18.000000 648.500000 60% 21.000000 889.000000 70% 25.000000 1234.300000 75% 27.000000 1542.500000 80% 30.000000 1990.400000 85% 34.000000 2665.800000 90% 40.000000 3810.800000 95% 51.000000 6008.050000 max 130.000000 30606.000000



