five

Old Bailey Voices 1780-1880

收藏
DataCite Commons2020-08-28 更新2025-04-16 收录
下载链接:
https://figshare.shef.ac.uk/articles/Old_Bailey_Voices_1780-1880/7177637/1
下载链接
链接失效反馈
官方服务:
资源简介:
The Old Bailey Proceedings 1674-1913 represent the largest body of direct recorded speech by non-elite people ever created. The Old Bailey Voices dataset (OBV) consists of a full text corpus and summary data for 21000 trials reported in the Proceedings between 1780 and 1880. <br>The dataset was created for the Voices of Authority research theme of the [Digital Panopticon project, in order to explore changing speech patterns in the courtroom.<br>The Old Bailey Corpus project headed by Magnus Huber added linguistic tagging to a large sample of the Proceedings data. OBV has recombined the linguistic corpus with trial data to enable Digital Panopticon researchers to associate individual defendants with their spoken words (or silences) in court and long-term outcomes.

1674年至1913年的《老贝利庭审记录》(Old Bailey Proceedings)是迄今为止现存规模最大的非精英群体直接口述实录文本集合。老贝利之声数据集(Old Bailey Voices, OBV)涵盖1780年至1880年间《老贝利庭审记录》中收录的21000起庭审案件的全文语料库与汇总数据。 该数据集为「数字全景敞视计划(Digital Panopticon project)」的「权威之声」研究主题开发,旨在探究法庭场景下言语模式的演变规律。 由马格努斯·胡伯(Magnus Huber)主持的老贝利语料库项目(Old Bailey Corpus project),曾为大量《老贝利庭审记录》样本数据添加语言标注。OBV将该带语言标注的语料库与庭审原始数据重新整合,使得「数字全景敞视计划」的研究人员能够将个体被告与其在法庭上的发言(或沉默)以及长期庭审结局进行关联。
提供机构:
The University of Sheffield
创建时间:
2018-10-12
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作