tppllm/stack-overflow
收藏Hugging Face2025-10-28 更新2025-04-26 收录
下载链接:
https://hf-mirror.com/datasets/tppllm/stack-overflow
下载链接
链接失效反馈官方服务:
资源简介:
这个数据集包含了2022年1月1日至2023年12月31日之间,Stack Overflow用户获得的badge奖项记录。数据集中有3,336个序列,包含187,836个事件和25种badge类型。数据来源于Stack Exchange数据转储,并遵循CC BY-SA 4.0许可。数据预处理步骤的详细信息可以在TPP-LLM论文和TPP-LLM-Embedding论文中找到。2025年10月28日的更新中,增加了三个时间戳字段:事件时间戳、自开始以来的时间戳和自上次事件以来的时间戳,未做其他更改。
This dataset contains badge awards earned by users on Stack Overflow between January 1, 2022, and December 31, 2023. It includes 3,336 sequences with 187,836 events and 25 badge types, derived from the Stack Exchange Data Dump under the CC BY-SA 4.0 license. The detailed data preprocessing steps used to create this dataset can be found in the TPP-LLM paper and TPP-LLM-Embedding paper. An update on October 28, 2025, added three timestamp fields: timestamp_event, timestamp_since_start, and timestamp_since_last_event, with no other changes made.
提供机构:
tppllm



