five

banned-books

收藏
github2026-03-18 更新2026-03-21 收录
下载链接:
https://github.com/data-liberation-project/banned-books
下载链接
链接失效反馈
官方服务:
资源简介:
该仓库包含美国各州监狱系统中被禁书籍的数据,旨在通过公共记录请求获取、清理和检查这些列表。这些数据以多种格式(如XML、PDF、Excel、CSV等)存在,需要通过志愿者协作进行整理和分析。

This repository hosts data on banned books across U.S. state prison systems. Its core objective is to obtain, clean, and review these lists via public records requests. The datasets are available in various formats including XML, PDF, Excel, CSV, etc., and demand collation and analysis through volunteer collaboration.
创建时间:
2026-03-11
原始信息汇总

数据集概述

数据集基本信息

  • 数据集名称:Collecting books banned in state prisons
  • 数据集主题:美国各州监狱系统禁书清单
  • 数据来源:通过公共记录请求从各州监狱系统获取
  • 数据格式:原始数据格式多样,包括XML、PDF、Excel、CSV等;处理后目标格式为CSV
  • 数据字段
    • title (字符型,必填):书籍标题
    • author (字符型,选填):书籍作者(如提供)
    • date (日期型,选填):书籍被审查和禁止的日期(如提供)
    • publication_type (字符型,选填):媒体类型(如提供)
    • rejection_reason (字符型,选填):书籍被拒绝的原因(如提供)

数据收集状态

已收到数据的州

  • 加利福尼亚州
  • 佛罗里达州
  • 伊利诺伊州
  • 堪萨斯州
  • 蒙大拿州
  • 德克萨斯州
  • 康涅狄格州
  • 佐治亚州
  • 爱荷华州
  • 密歇根州
  • 新泽西州
  • 弗吉尼亚州

已请求但尚未收到数据的州

  • 俄勒冈州
  • 密苏里州
  • 北卡罗来纳州
  • 罗德岛州
  • 南卡罗来纳州
  • 亚利桑那州
  • 威斯康星州

项目背景与协作

  • 项目目的:收集并清理美国各州监狱系统的禁书清单数据,以支持对监狱书籍审查情况的调查与分析。
  • 协作组织:MuckRock的Data Liberation Project与The Marshall Project合作开展。
  • 相关成果:此数据为The Marshall Project 2023年调查系列奠定了基础,该系列包括一份被数十家地方新闻编辑室用于审查州监狱书籍禁运情况的报告工具包。

数据处理与贡献

  • 数据处理流程:志愿者通过分叉代码库、选择州数据、编写提取脚本(可使用任何编程语言)、清理数据并转换为标准CSV格式,最后提交拉取请求。
  • 数据存放路径:清理后的数据文件应保存至data/processed目录,命名格式为cleaned_state_name.csv
  • 后续分析计划:计划将清理后的数据集导入Datasette,以便志愿者进行探索并标记特别令人关注的书籍禁令。
  • 其他参与方式:除数据处理外,志愿者也可参与提交更多公共记录请求或通过创建Markdown笔记文件(state_name_notes.md)来标注特定书籍。
搜集汇总
数据集介绍
main_image_url
构建方式
在监狱书籍审查研究领域,banned-books数据集通过公共记录请求系统性地收集了美国各州监狱系统禁书清单。该项目由MuckRock的数据解放计划与马歇尔计划合作推进,志愿者从各州监狱管理机构获取原始数据,这些数据以XML、PDF、Excel、CSV等多种格式呈现。随后,社区贡献者通过编写脚本提取和清洗数据,将其统一转换为结构化表格,并按照标准化的字段规范进行整理,最终形成可供分析的清洁数据集。
使用方法
研究人员与记者可通过访问GitHub仓库获取已处理的CSV文件,直接用于定量分析或可视化探索。数据集支持对禁书主题、审查趋势及地域差异的跨州比较研究。使用者亦可加入Slack社区参与数据清洗工作,或利用Datasette平台进行交互式查询。对于希望深入调查的学者,该数据可与外部数据库结合,进一步探究审查政策与社会因素之间的关联。
背景与挑战
背景概述
在信息自由与监狱系统透明度日益受到关注的背景下,banned-books数据集应运而生。该数据集由MuckRock的数据解放项目与The Marshall Project于2023年合作创建,旨在系统收集美国各州监狱系统中被禁书籍的详细记录。其核心研究问题聚焦于揭示监狱环境下的书籍审查机制与范围,通过公开记录请求获取原始数据,为新闻调查与学术研究提供了关键实证基础。这一举措不仅延续了The Marshall Project此前关于监狱禁书的深度报道,还推动了数十家地方新闻机构对监狱 censorship 现象的本地化调查,显著提升了公众对监狱信息管控的认识。
当前挑战
banned-books数据集面临多重挑战。在领域问题层面,监狱书籍禁令涉及复杂的法律、伦理与社会政策议题,数据集需准确反映不同州份的审查标准与理由,但各州政策差异巨大,统一归类与原因分析存在困难。在构建过程中,数据获取依赖于公共记录请求,响应效率与完整性参差不齐;原始数据格式繁杂,涵盖XML、PDF、Excel、CSV等多种形式,提取与清洗需大量人工干预。此外,部分州未集中管理禁书清单,需向地方机构分散请求,进一步增加了数据收集的难度与时间成本。
常用场景
经典使用场景
在监狱系统与言论自由研究的交叉领域,banned-books数据集为学者提供了关键的数据支撑。该数据集最经典的使用场景是支持对监狱系统中图书审查制度的系统性分析,研究者通过整合各州监狱的禁书清单,能够深入探讨审查标准、禁书类型及其背后的政策逻辑。例如,在社会科学研究中,学者利用这些数据量化审查趋势,识别被频繁禁止的书籍主题,从而揭示监狱管理中的文化控制机制。这种分析不仅依赖于数据清洗与标准化处理,还促进了跨州比较研究,为理解监狱环境下的信息管控提供了实证基础。
解决学术问题
该数据集有效解决了学术研究中关于监狱系统信息管控与言论自由的若干核心问题。通过提供标准化的禁书记录,它帮助研究者克服了数据碎片化与获取困难的挑战,使得对审查制度的定量分析成为可能。具体而言,数据集支持探讨禁书政策如何影响囚犯的教育与康复机会,以及审查行为是否与种族、性别等社会因素相关联。这些研究深化了对监狱系统中权力运作与权利限制的理解,为法律、社会学及政治学领域的学术辩论提供了数据驱动的见解,推动了相关理论框架的完善。
实际应用
在实际应用层面,banned-books数据集被新闻机构与非政府组织广泛用于调查报道与倡导工作。例如,The Marshall Project基于此数据开展了深入的调查系列,揭示了各州监狱禁书的规模与模式,并开发了报道工具包供地方新闻编辑室使用。这些实践不仅提升了公众对监狱审查问题的关注,还促进了政策讨论与改革倡导。数据集的开放协作模式鼓励志愿者参与数据清理与分析,增强了公民社会对政府透明度的监督能力,体现了数据在推动社会正义中的实际价值。
数据集最近研究
最新研究方向
在监狱系统与言论自由研究领域,banned-books数据集正推动前沿探索,聚焦于美国各州监狱禁书政策的系统性分析。该数据集通过公开记录请求整合多州禁书清单,其最新研究方向涉及数据标准化处理与跨州比较,以揭示书籍审查的模式、趋势及潜在法律与社会影响。相关热点事件包括2023年《马歇尔计划》的调查系列报道,该报道利用此数据集工具包,引发数十家地方新闻机构对监狱书籍审查的广泛关注,凸显了数据在推动公共问责与透明度方面的重要意义。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作