five

CU Boulder ChangeMyView Comment Removal Data v1.0

收藏
github2019-11-10 更新2024-05-31 收录
下载链接:
https://github.com/BoulderDS/effect_of_comment_deletion_cmv_dataset
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含五个文件,用于查找论文中所有分析所使用的相关评论。每个文件都是一个压缩的jsonlist文件,每行是一个json对象。

This dataset comprises five files, each utilized to identify relevant comments used in all analyses within the research papers. Each file is a compressed jsonlist file, with each line representing a json object.
创建时间:
2019-11-08
原始信息汇总

数据集概述

数据集名称

CU Boulder ChangeMyView Comment Removal Data v1.0

发布时间

October, 2019

数据集内容

该数据集包含五个文件,用于支持论文中的分析:

  1. Interrupted time-series analysis in non-affected trees:

    • 文件名:its_dataset.json.gz
    • 内容:每行包含评论删除前后的评论ID、被删除的评论ID和作者ID。
  2. Applying the delayed feedback approach in non affected trees:

    • 文件名:delayed_feedback_setup_non_treatment_trees.json.gz
    • 内容:每行包含处理作者ID、控制作者ID、处理删除的评论ID、控制删除的评论ID、处理删除前后的评论ID、控制虚拟删除前后的评论ID。
  3. Delayed feedback in affected trees:

    • 文件名:delayed_feedback_setup_treatment_trees.json.gz
    • 内容:每行包含处理作者ID、控制作者ID、处理删除的评论ID、控制删除的评论ID、处理删除前后的评论ID、控制虚拟删除前后的评论ID。
  4. First and second removals of an author:

    • 文件名:first_and_second_removals.json.gz
    • 内容:每行包含评论ID、作者ID和链接ID。
  5. First removals of an author:

    • 文件名:first_removals.json.gz
    • 内容:每行包含评论ID、作者ID和链接ID。

文件格式

所有文件均为压缩的jsonlist格式,每行是一个json对象。

搜集汇总
数据集介绍
main_image_url
构建方式
CU Boulder ChangeMyView Comment Removal Data v1.0数据集的构建,是基于ChangeMyView社区中的评论移除行为,通过收集并整理了评论移除前后的评论ID、作者ID以及链接ID等信息,形成了五个压缩的jsonlist文件。这些文件详细记录了评论移除的时间序列、延迟反馈设置以及作者首次和两次移除行为的数据,为研究内容移除作为一种社区管理策略提供了基础数据。
使用方法
使用该数据集时,用户需先解压jsonlist文件,之后可以利用编程语言如Python中的json库来解析数据,进行数据清洗、分析和模型构建等操作。用户在使用数据集及其相关材料时,应遵循数据使用规范,并在研究成果中引用数据集来源,以符合学术诚信的要求。
背景与挑战
背景概述
CU Boulder ChangeMyView Comment Removal Data v1.0 数据集,诞生于2019年10月,由Kumar Bhargav Srinivasan、Cristian Danescu-Niculescu-Mizil、Lillian Lee和Chenhao Tan等研究人员共同构建。该数据集的创建旨在深入探索网络社区中内容移除作为一种调控策略的效果,特别是针对ChangeMyView社区中的遵守性与其他结果进行详细分析。该数据集的发布,为网络内容治理与社区调控策略研究提供了宝贵的实验资源,对网络社会学与计算社会科学领域产生了重要影响。
当前挑战
该数据集在构建过程中面临的挑战主要包括:如何在保证用户隐私的前提下,精确地识别并提取相关评论;如何有效地处理大规模数据,保证数据的一致性与准确性;以及如何确保所收集数据能够全面反映社区内内容移除的实际情况。在研究领域问题上,数据集面临的挑战是如何准确衡量内容移除策略对社区行为和氛围的长远影响,以及如何量化这种策略对用户遵守性的具体作用。
常用场景
经典使用场景
针对网络社区言论调控策略的研究,CU Boulder ChangeMyView Comment Removal Data v1.0 数据集提供了宝贵的实证材料。该数据集记录了特定社区内评论被移除前后的详细信息,为分析内容移除作为一种调控策略的效果提供了数据支撑。研究者可以借助此数据集,探究移除评论对社区氛围、用户行为等的影响。
解决学术问题
该数据集解决了如何量化内容移除策略对网络社区行为规范遵守度及其他后果的研究问题。通过提供实际评论移除案例的数据,它使得研究者能够评估内容移除在促进社区规范遵守、减少不当言论等方面的实际效果,对于理解网络社区管理机制具有重要意义。
实际应用
在实际应用中,该数据集可用于指导网络社区管理策略的制定,优化内容审核机制,提升社区互动质量。同时,它也助力于开发更为智能的自动化内容审核工具,以辅助人工审核,提高审核效率和准确性。
数据集最近研究
最新研究方向
在互联网内容治理领域,CU Boulder ChangeMyView Comment Removal Data v1.0数据集为学者们提供了一个珍贵的研究资源。该数据集关联的研究聚焦于内容移除作为一种社区管理策略的合规性及其效果,特别是在ChangeMyView社区中的实际应用情况。通过深入剖析该数据集,研究人员可以探究社区成员对评论移除的反应,以及这一策略对社区互动和言论环境的长远影响。该研究不仅推动了网络内容监管机制的发展,也为政策制定者和平台运营者提供了实证依据,具有重要的现实意义和理论价值。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作