five

CLaSSES

收藏
github2023-05-15 更新2024-05-31 收录
下载链接:
https://github.com/CIRCSE/CLaSSES
下载链接
链接失效反馈
官方服务:
资源简介:
CLaSSES是一个数字资源,收集了非文学拉丁文本,包括铭文、书写板、信件等,这些文本来自罗马帝国的不同时期和省份。每个文本都标记有语言和超语言信息,以便于分析拉丁非文学来源中的拼写变异,以及罗马世界的语言社会背景。

CLaSSES is a digital resource that collects non-literary Latin texts, including inscriptions, writing tablets, letters, etc., from various periods and provinces of the Roman Empire. Each text is annotated with linguistic and metalinguistic information to facilitate the analysis of spelling variations in non-literary Latin sources and the sociolinguistic context of the Roman world.
创建时间:
2022-12-20
原始信息汇总

数据集概述

名称: CLaSSES (Corpus for Latin Sociolinguistic Studies on Epigraphic textS)

描述: CLaSSES是一个数字资源,收集了罗马帝国不同时期和省份的非文学拉丁文文本,包括铭文、书写板和信件。每个文本都附有语言和非语言信息,便于分析拉丁非文学来源中的拼写变异,并结合罗马世界的语言社会背景进行研究。

数据集组成:

  • Corpus Epistularum Latinarum Papyris Ostracis Tabulis servatarum (CEL)
  • Corpus Inscriptionum Latinarum (CIL)
  • Vindolanda writing tablets edited by Bowman and Thomas (1983-2003) and Bowman, Thomas and Tomlin (2010-2019) (BTT)
  • Album of dated Latin inscriptions (GORDON)
  • Inscriptiones latinae liberae rei publicae (ILLRP)
  • L’epigrafia latina in Sardegna dopo il C.I.L. X e l’E.E. VIII (ANRW)
  • Le iscrizioni cristiane della Sardegna anteriori al VII secolo (ICS)
  • Ephemeris epigraphica. Corporis inscriptionum Latinarum supplementum (EE VIII)
  • Le iscrizioni funerarie pagane di Karales (IFPK)
  • Iscrizioni Latine della Sardegna (ILSard)

版权: 该数据集根据Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License授权。

创建者:

  • Giovanna Marotta
  • Serena Barchi
  • Francesca Cotugno
  • Irene De Felice
  • Margherita Donati
  • Francesco Rovai
  • Lucia Tamponi
  • Stefano Dei Rossi

贡献者:

  • Giovanni Moretti
  • Federica Iurescia
  • Marco Passarotti
  • Paolo Ruffolo
  • Giovanna Marotta
  • Francesco Rovai
  • Irene De Felice
  • Lucia Tamponi
  • Stefano Dei Rossi

引用信息: Giovanni Moretti, Federica Iurescia, Marco Carlo Passarotti, Paolo Ruffolo, Giovanna Marotta, Irene De Felice, Lucia Tamponi, Francesco Rovai, & Stefano Dei Rossi. (2022). CIRCSE/CLaSSES: CLaSSES (v1.0.0). Zenodo. https://doi.org/10.5281/zenodo.7463304

搜集汇总
数据集介绍
main_image_url
构建方式
CLaSSES数据集由比萨大学语言学系开发,旨在收集罗马帝国不同时期和地区的非文学拉丁文本,包括铭文、书写板和信件等。每个文本均标注了语言学和超语言学信息,使得研究者能够在罗马世界的社会语言学背景下分析拉丁非文学文本中的拼写变异。该数据集通过RDF格式与LiLa知识库链接,包含多个子文档,涵盖了广泛的拉丁铭文资源。
特点
CLaSSES数据集的特点在于其广泛覆盖了罗马帝国不同时期和地区的非文学拉丁文本,提供了丰富的语言学和超语言学标注信息。这些标注信息使得研究者能够深入探讨拉丁文本中的拼写变异与社会语言学背景之间的关系。此外,数据集通过RDF格式与LiLa知识库链接,增强了数据的可访问性和互操作性,为历史语言学研究提供了宝贵的资源。
使用方法
CLaSSES数据集的使用方法包括通过其RDF格式与LiLa知识库进行链接,研究者可以访问和查询数据集中的多个子文档。每个子文档均提供了详细的拉丁铭文资源,研究者可以根据需要选择特定的文本进行分析。此外,数据集的语言学和超语言学标注信息为研究者提供了丰富的分析维度,使得他们能够在罗马世界的社会语言学背景下探讨拉丁文本的拼写变异。
背景与挑战
背景概述
CLaSSES(Corpus for Latin Sociolinguistic Studies on Epigraphic textS)是一个专注于收集罗马帝国时期不同地区和时期的非文学拉丁文本的数字资源,包括铭文、书写板和信件等。该数据集由意大利比萨大学的语言学、文学与语言学系开发,旨在通过语言学和超语言学信息的标注,分析拉丁非文学文本中的拼写变异,并探讨其与罗马世界社会语言学背景的关系。CLaSSES的创建源于PRIN2010项目,并得到了欧洲研究委员会的资助。其RDF版本通过与LiLa知识库的链接,进一步扩展了数据的可用性和研究价值。该数据集为拉丁语社会语言学研究提供了重要的基础资源,推动了历史语言学和社会语言学的交叉研究。
当前挑战
CLaSSES数据集在构建和应用过程中面临多重挑战。首先,拉丁非文学文本的多样性和复杂性使得数据的收集和标注变得极为困难,尤其是在处理不同时期和地区的文本时,拼写变异和语言风格的变化需要精细的标注和分析。其次,数据集的社会语言学分析要求结合历史背景和文化语境,这对研究者的跨学科能力提出了较高要求。此外,数据集的RDF版本与LiLa知识库的链接虽然增强了数据的互操作性,但也带来了技术上的复杂性,尤其是在数据整合和语义标注方面。最后,尽管数据集为非商业用途提供了开放访问,但其复杂的许可协议可能限制了部分研究者的使用。这些挑战共同构成了CLaSSES数据集在推动拉丁语社会语言学研究中的关键障碍。
常用场景
经典使用场景
CLaSSES数据集在拉丁语言学研究中扮演了重要角色,尤其适用于分析罗马帝国时期非文学拉丁文本中的拼写变异。通过整合不同时期和地区的碑文、书写板及信件等非文学文本,研究者能够深入探讨拉丁语在社会语言学背景下的演变。数据集中的每个文本均附有语言学和超语言学信息,为研究提供了丰富的上下文支持。
实际应用
在实际应用中,CLaSSES数据集被广泛用于历史语言学、社会语言学和数字人文领域的研究。例如,研究者可以利用该数据集分析罗马帝国不同地区的语言使用差异,揭示语言与身份认同之间的关系。此外,该数据集还为教育领域提供了丰富的教学资源,帮助学生更好地理解拉丁语的历史演变。
衍生相关工作
CLaSSES数据集催生了一系列相关研究,特别是在拉丁语社会语言学和数字人文领域。例如,基于该数据集的研究成果已被用于构建更广泛的拉丁语知识库,如LiLa知识库。此外,该数据集还促进了跨学科合作,推动了语言学与历史学、考古学等领域的深度融合,衍生出多篇具有影响力的学术论文和项目。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作