One Million Checkboxes Data
收藏github2024-09-17 更新2024-09-18 收录
下载链接:
https://github.com/nolenroyalty/one-million-checkboxes-data-scripts
下载链接
链接失效反馈资源简介:
One Million Checkboxes (OMCB) 是一个于2024年6月26日发布的网站,拥有一百万个复选框。这些复选框是全球性的,检查或取消检查一个复选框会对所有网站用户生效。该网站在两周内吸引了数十万玩家,检查或取消检查了超过6.5亿个复选框。数据集记录了这些复选框的状态变化,并包含用户在复选框状态中隐藏的图像和链接。
One Million Checkboxes (OMCB) is a website launched on June 26, 2024, which consists of one million checkboxes. These checkboxes operate globally: toggling any single checkbox (either checking or unchecking it) will take effect for all website users. Within two weeks after its launch, the website attracted hundreds of thousands of participants, with over 650 million checkbox toggle operations performed. The dataset records all state changes of these checkboxes, and also contains the hidden images and links embedded in the checkbox states by users.
创建时间:
2024-09-17
原始信息汇总
One Million Checkboxes 数据集概述
数据集简介
- 名称: One Million Checkboxes (OMCB)
- 发布日期: 2024年6月26日
- 持续时间: 2周
- 参与人数: 数百万人
- 操作次数: 超过6.5亿次勾选或取消勾选
数据集内容
- 数据格式:
.log文件 - 数据结构:
TIME|BOX_NUMBER|CHECK_OR_UNCHECKTIME: 时间戳(UTC)BOX_NUMBER: 复选框编号CHECK_OR_UNCHECK: 勾选状态(1为勾选,0为取消勾选)
- 数据量: 超过6.5亿条记录
数据集特点
- 全球同步: 勾选或取消勾选对所有用户实时生效
- 隐藏内容: 用户在数据中隐藏了图像和链接
- 二进制和Base64编码: 用户使用二进制和Base64编码隐藏信息
数据集下载
- 下载地址: Internet Archive
- 数据目录结构:
omcb-datapre-crashpost-crash-pre-sunsetpost-sunset
- 每个子目录包含
.log文件和.db文件
数据集使用
- 工具: 提供生成图像和时间流逝视频的工具
- 使用步骤:
- 下载数据
- 解压数据到
omcb-data目录 - 运行
python omcb.py生成时间流逝视频
数据集限制
- 数据缺失: 数据集在网站启动后的前几个小时内缺失数据
- 数据不完整: 由于服务器崩溃和重启,数据存在丢失和重复
- 数据分段: 数据分为三个时期:
pre-crash,post-crash-pre-sunset,post-sunset
搜集汇总
数据集介绍

构建方式
One Million Checkboxes Data数据集的构建基于一个名为'One Million Checkboxes'的在线实验项目。该项目于2024年6月26日启动,提供了一百万个复选框供全球用户操作。在项目运行的两周内,收集了超过6.5亿次复选框的点击数据。数据集通过记录每次点击的时间、复选框编号及状态变化来构建,最终形成了一个包含时间序列信息的日志文件集合。这些日志文件被分为三个不同的‘时代’,分别对应项目运行的不同阶段,每个阶段的数据存储在独立的子目录中,便于后续分析和处理。
特点
One Million Checkboxes Data数据集的显著特点在于其大规模和实时性。数据集不仅记录了复选框的状态变化,还捕捉了用户行为的时间序列特征,为研究群体行为和网络动态提供了宝贵资源。此外,数据集中的日志文件格式统一,便于自动化处理和分析。数据集还包含了用户在复选框状态中隐藏的图像和信息,增加了数据集的趣味性和研究价值。
使用方法
使用One Million Checkboxes Data数据集,首先需要从互联网档案馆下载数据,并将其解压至指定目录。随后,用户可以通过提供的Python脚本进行数据处理和可视化。例如,用户可以生成时间流逝视频或热力图,以观察复选框状态随时间的变化。脚本支持自定义时间范围和帧率,用户可以根据需求调整参数以生成特定的时间序列分析结果。此外,数据集的日志文件格式标准化,便于用户进行进一步的定制化分析和研究。
背景与挑战
背景概述
One Million Checkboxes Data(OMCB)数据集源自于2024年6月26日发布的一个名为One Million Checkboxes的网站。该网站的核心概念是提供一百万个复选框,用户可以全球范围内实时查看和操作这些复选框的状态。在网站运行的两周内,超过6.5亿次复选框的操作被记录下来。这一数据集由主要研究人员或机构创建,旨在探索大规模在线互动行为的数据分析。OMCB数据集不仅记录了用户的行为,还揭示了用户如何在复选框的状态中隐藏图像和信息,这对于理解人类集体行为和信息隐藏技术具有重要意义。
当前挑战
OMCB数据集在构建过程中面临了多个挑战。首先,数据在网站启动后的最初几小时内丢失,且在服务器崩溃或重启时也丢失了部分数据,导致数据的不完整性。其次,数据被分为三个不同的‘时代’,每个时代的数据状态不同,增加了数据处理的复杂性。此外,用户在复选框中隐藏图像和信息的行为,使得数据分析不仅要处理简单的复选框状态变化,还需要识别和解析隐藏的信息。这些挑战要求研究人员在数据处理和分析过程中具备高度的技术能力和创新思维。
常用场景
经典使用场景
One Million Checkboxes Data数据集的经典使用场景主要集中在时间序列分析和可视化领域。通过该数据集,研究者可以生成时间流逝下的复选框状态变化的时间轴视频,揭示用户行为随时间的变化趋势。此外,数据集还支持生成热图,展示特定时间段内复选框状态变化的频率和分布,从而深入分析用户交互的模式和规律。
衍生相关工作
One Million Checkboxes Data数据集催生了多项相关研究工作。例如,有研究利用该数据集开发了新的时间序列分析算法,提升了对复杂用户行为的预测精度。此外,数据集还启发了关于大规模在线互动系统设计和优化的研究,推动了社会计算和人类行为建模领域的发展。同时,数据集在隐写术和信息隐藏领域的应用,也促进了相关技术的创新和实践。
数据集最近研究
最新研究方向
在One Million Checkboxes Data的最新研究中,学者们聚焦于利用该数据集进行社会行为分析和信息隐藏技术的探索。通过分析用户在短时间内对大量复选框的操作,研究者们能够揭示出群体行为的模式和趋势,这对于理解在线社区的动态具有重要意义。此外,数据集中隐藏的图像和二进制信息为信息隐藏和加密技术提供了新的研究视角,推动了相关领域的技术进步。这些研究不仅丰富了我们对在线互动行为的理解,也为网络安全和数据隐私保护提供了新的思路。
以上内容由遇见数据集搜集并总结生成



