five

VicVaDis

收藏
github2023-10-27 更新2024-05-31 收录
下载链接:
https://github.com/QuoVaDis-LancasterUniversity/VicVaDis
下载链接
链接失效反馈
官方服务:
资源简介:
一个包含3.5百万单词的维多利亚反疫苗论述语料库(VicVaDis),由133份反疫苗小册子和出版物组成,收集自1854年至1906年,这一时期大致与维多利亚时代(1837-1901)重合。

A 3.5-million-word Victorian anti-vaccination discourse corpus (VicVaDis), composed of 133 anti-vaccination pamphlets and publications, was collected between 1854 and 1906, a period largely overlapping with the Victorian era (1837–1901).
创建时间:
2023-09-07
原始信息汇总

数据集概述

数据集名称

VicVaDis

数据集内容

  • 包含133份反疫苗宣传册和出版物。
  • 数据总量约为350万字。
  • 收集时间跨度为1854年至1906年,共53年。

创建机构

  • 由Lancaster大学的ESRC Centre for Corpus Approaches to Social Science (CASS)下的Questioning Vaccination Discourse (Quo VaDis)项目创建。

版权许可

  • 依据Creative Commons Attribution License CC BY 4.0发布,允许无限制地重用、分发和复制,前提是正确引用原始数据集。

引用信息

  • 引用格式:Claire Hardaker, Alice Deignan, Elena Semino, Tara Coltman-Patel, William Dance, Zsófia Demjén, Chris Sanderson, Derek Gatherer, The Victorian anti-vaccination discourse corpus (VicVaDis): construction and exploration, Digital Scholarship in the Humanities, 2023;, fqad075, https://doi.org/10.1093/llc/fqad075
搜集汇总
数据集介绍
main_image_url
构建方式
VicVaDis数据集的构建基于19世纪中叶至20世纪初期的133份反疫苗接种宣传册和出版物,涵盖了1854年至1906年间的53年时间跨度。这些文献由英国兰卡斯特大学的社会科学语料库研究中心(CASS)的Quo VaDis项目收集整理,旨在捕捉维多利亚时代反疫苗接种话语的演变与特征。通过数字化处理与文本分析,数据集以科学严谨的方式呈现了历史文献的原始内容。
特点
VicVaDis数据集包含350万词汇量,时间跨度长达53年,涵盖了维多利亚时代反疫苗接种运动的核心文献。其独特之处在于提供了丰富的历史语境,使研究者能够深入分析反疫苗接种话语的语言特征、社会背景及其演变过程。数据集的多样性和时间深度为历史语言学、社会语言学以及公共卫生政策研究提供了宝贵的资源。
使用方法
VicVaDis数据集适用于多种研究场景,包括历史话语分析、社会运动研究以及公共卫生政策的历史比较。研究者可通过文本挖掘、词频分析、主题建模等方法探索反疫苗接种话语的语言模式与社会影响。数据集以开放获取的形式发布,遵循CC BY 4.0许可协议,用户需在引用时注明原始出处,以确保学术规范与数据共享的透明度。
背景与挑战
背景概述
VicVaDis数据集是由英国兰卡斯特大学ESRC社会科学语料库方法研究中心(CASS)的Questioning Vaccination Discourse(Quo VaDis)项目创建的,旨在研究维多利亚时代(1854-1906年)的反疫苗话语。该数据集包含133份反疫苗小册子和出版物,总计350万词,时间跨度与维多利亚时代(1837-1901年)大致重合。通过这一数据集,研究人员能够深入探讨19世纪反疫苗运动的语言特征、社会背景及其对公共卫生政策的影响。该数据集为历史语言学、社会语言学以及公共卫生政策研究提供了宝贵的资源。
当前挑战
VicVaDis数据集在构建过程中面临多重挑战。首先,历史文献的数字化和文本清洗工作复杂,尤其是19世纪的印刷品可能存在字迹模糊、排版不规范等问题,增加了数据处理的难度。其次,反疫苗话语的多样性和复杂性要求研究人员在标注和分析时具备跨学科的知识背景,包括历史学、语言学和社会学等。此外,如何在不失原意的前提下对历史文本进行现代语言学的分析,也是一个重要的技术挑战。这些挑战不仅影响了数据集的构建效率,也对后续的研究方法提出了更高的要求。
常用场景
经典使用场景
VicVaDis数据集主要用于研究维多利亚时代反疫苗接种话语的历史演变和社会影响。该数据集包含了1854年至1906年间133份反疫苗接种的小册子和出版物,总计350万词,为学者提供了丰富的文本资源,用于分析这一时期反疫苗接种运动的语言特征、社会背景及其对公共卫生政策的影响。
实际应用
在实际应用中,VicVaDis数据集被广泛用于教育、公共卫生政策制定和历史研究领域。教育机构可以利用该数据集进行历史文本分析的教学,帮助学生理解语言与社会运动的互动关系。公共卫生政策制定者则可以通过分析历史反疫苗接种话语,制定更具针对性的疫苗接种宣传策略,提升公众对疫苗的信任度。
衍生相关工作
基于VicVaDis数据集,学者们已经开展了多项经典研究。例如,Claire Hardaker等人利用该数据集分析了维多利亚时代反疫苗接种话语的语言特征,揭示了其与当代反疫苗接种运动的相似性。此外,该数据集还催生了多篇关于历史文本数字化处理和社会话语分析的论文,推动了数字人文领域的发展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作