VISiBL Corpus

github2021-04-02 更新2024-05-31 收录

下载链接：

https://github.com/browndw/visibl_corpus

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含英国文学中的语言和帝国主题，分析了1768至1929年间英国作者的小说、短篇故事和戏剧中的非洲散居、中国和印度角色的语言表达。数据集研究了文学方言的使用，并探讨了这些表达如何与当时的政治、社会和文化条件相关联。

This dataset encompasses themes of language and empire in British literature, analyzing the linguistic expressions of African diaspora, Chinese, and Indian characters in novels, short stories, and plays by British authors from 1768 to 1929. The dataset investigates the use of literary dialects and explores how these expressions are connected to the political, social, and cultural conditions of the time.

创建时间：

2021-04-01

原始信息汇总

VISiBL Corpus 概述

数据集名称

VISiBL Corpus

数据集内容

包含英国文学中关于帝国主题发声的文本，主要分析1768至1929年间英国作者出版的小说、短篇故事和戏剧。
数据集中的文本包含文学方言的例子，这些方言通过特定的语法结构和拼写方式来表现不同文化背景的人物对话。

研究目的

分析非洲散居、中国和印度角色在英国文学中的发声方式，探讨这些发声与帝国政治经济、语言意识形态及社会文化焦虑之间的关系。
通过结合统计模型和档案研究，探讨文学作品中对这些角色的语言表达如何反映当时的政治、社会和文化背景。

注意事项

数据集中包含种族歧视语言和对非洲散居、中国及印度角色、社区和语音文化的贬低描述。

搜集汇总

数据集介绍

构建方式

VISiBL语料库的构建基于对1768年至1929年间英国作家创作的小说、短篇故事和戏剧的系统收集与分析。这些文本通过统计建模和档案研究相结合的方法，深入探讨了非洲裔、华裔和印度裔角色在英国文学中的语言表达方式。语料库的构建不仅关注文学作品本身，还将其与帝国政治经济的变化、英语世界的语言意识形态演变以及跨种族和帝国的社会文化焦虑联系起来，形成了一个多维度的研究框架。

特点

VISiBL语料库的显著特点在于其专注于文学方言的呈现，即通过语法结构和拼写变化来模拟特定群体的语言特征。这些语言表达并非中立的语言模仿，而是与当时英国及其帝国的政治、社会和文化背景紧密相关。语料库中的文本反映了对非洲裔、华裔和印度裔角色的刻板印象，揭示了这些表达如何强化和放大当时的种族偏见和文化焦虑。语料库的构建不仅为文学研究提供了丰富的素材，也为语言学和历史学的研究提供了独特的视角。

使用方法

使用VISiBL语料库时，研究者可以通过定量和定性相结合的方法，深入分析文学方言的语言特征及其背后的社会文化意义。语料库中的文本可用于研究特定历史时期英国文学中的种族表征、语言意识形态的演变以及帝国政治经济对文学创作的影响。此外，语料库还可用于跨学科研究，例如结合历史学、社会学和语言学的方法，探讨文学作品如何反映和塑造社会对特定群体的认知。在使用过程中，研究者需注意语料库中可能包含的种族主义语言和贬低性描述，以确保研究的客观性和敏感性。

背景与挑战

背景概述

VISiBL语料库（Voicing Imperial Subjects in British Literature）是为《英语与帝国》一书所构建的，旨在分析1768年至1929年间英国作家创作的小说、短篇故事和戏剧。该语料库由剑桥大学出版社于2019年发布，主要研究人员包括文学与语言学领域的学者。其核心研究问题聚焦于英国文学中非洲裔、华裔和印度裔角色的语言表征，探讨这些表征如何与帝国政治经济、语言意识形态以及跨种族与帝国的社会文化焦虑相关联。该语料库通过结合定量与定性研究方法，为文学方言的研究提供了重要的数据支持，推动了文学与语言学交叉领域的发展。

当前挑战

VISiBL语料库的研究挑战主要体现在两个方面。首先，其核心问题涉及文学方言的复杂性与多样性，如何准确捕捉并分析这些语言表征的细微差异，尤其是其与历史、政治和社会背景的关联，是一个重要的学术难题。其次，语料库构建过程中面临文本选择的挑战，需确保样本的多样性与代表性，同时还需处理历史文本中存在的种族主义语言和贬低性描绘，这对研究者的伦理敏感性和方法论提出了更高要求。这些挑战不仅考验了研究者的技术能力，也对其跨学科知识储备提出了更高标准。

常用场景

经典使用场景

VISiBL Corpus 主要用于研究英国文学中的文学方言（literary dialect），特别是1768年至1929年间英国小说和戏剧中非洲裔、华裔和印度裔角色的语言表达方式。通过分析这些文学作品中的人物对话，研究者可以深入探讨语言表达如何反映当时英国帝国的政治经济变化、语言意识形态的演变以及种族与帝国交织的社会文化焦虑。

解决学术问题

VISiBL Corpus 解决了文学研究中关于语言与权力关系的核心问题。通过结合定量与定性分析方法，该数据集揭示了文学方言如何被用作塑造和强化种族刻板印象的工具。这一研究不仅深化了对英国帝国时期文学语言的理解，还为跨学科研究提供了方法论上的创新，推动了文学、语言学和社会历史学的交叉研究。

衍生相关工作

VISiBL Corpus 的发布催生了一系列相关研究，特别是在文学方言与帝国意识形态的关系领域。例如，基于该数据集的研究揭示了英国文学中非洲裔、华裔和印度裔角色的语言表达如何反映了当时的种族偏见和社会焦虑。此外，该数据集还激发了关于数字人文方法在文学研究中的应用的讨论，推动了远距离阅读与近距离阅读相结合的研究范式的发展。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集