liederCorpus

github2022-12-24 更新2024-05-31 收录

下载链接：

https://github.com/corpusmusic/liederCorpusAnalysis

下载链接

链接失效反馈

官方服务：

资源简介：

包含19世纪德国艺术歌曲的诗歌文本和国际音标（IPA）转录的数据集，用于音乐文本关系的研究。

A dataset containing the poetic texts and International Phonetic Alphabet (IPA) transcriptions of 19th-century German art songs, intended for research on the relationship between music and text.

创建时间：

2015-05-15

原始信息汇总

数据集概述

数据集名称

名称: liederCorpusAnalysis

数据集内容

文本文件: 包含19世纪著名艺术歌曲的德语诗歌及对应的IPA（国际音标）转录。
德国-IPA字典: 用于自动翻译诗歌的工具。
Python脚本: 用于分析诗歌的IPA转录，包括poemAnalysis.py和GermanToIPA.py等。
R脚本: 用于执行歌曲间的基本相关性分析。
统计输出数据: 存储在statOutput文件夹中，包含poemAnalysis.py的运行结果。

数据集管理

数据类型: 主要数据包括诗歌文本、IPA转录、音乐转录及分析脚本。
数据格式: 所有数据和脚本均为纯文本格式，便于人类阅读和编辑。
元数据: 包含作曲家、国籍、文本语言、诗歌/歌曲标题等信息，存储在**kern源文件中。
访问与共享政策: 数据存储在GitHub公共仓库，所有用户可查看、复制和下载数据，但仅研究团队成员可修改仓库。
重用和分发政策: 所有数据和软件均采用开放许可，诗歌和音乐源材料为公共领域。

数据集维护与保存

保存计划: 数据以纯文本格式保存，确保与未来技术的兼容性。项目数据不仅存储在GitHub，还备份在多个大学和个人设备上。
长期保存: 项目完成后，将向CU Scholar提交压缩的纯文本数据文件和脚本，以进行长期保存。

搜集汇总

数据集介绍

构建方式

liederCorpus数据集的构建基于19世纪德国艺术歌曲的诗歌文本及其国际音标（IPA）转录。数据集通过SIL工具进行转录，并包含一个德语-IPA词典，用于自动翻译诗歌文本。此外，数据集还通过Python脚本对诗歌的元音内容进行分析，生成关于元音类型出现概率的统计数据。所有数据均以纯文本格式存储，确保其可读性和兼容性。

特点

liederCorpus数据集的特点在于其专注于19世纪德国艺术歌曲的诗歌文本及其语音转录。数据集不仅包含原始诗歌文本和IPA转录，还提供了自动翻译和词典扩展功能。通过Python脚本，数据集能够对诗歌的元音内容进行详细分析，生成按歌曲、诗节和诗句分类的统计数据。所有数据均以开源形式提供，便于研究人员和音乐教育者使用。

使用方法

使用liederCorpus数据集时，用户可以通过GitHub下载整个仓库，并运行提供的Python和R脚本进行数据分析。数据集中的诗歌文本和IPA转录可直接在GitHub上查看。用户还可以通过修改脚本参数，自定义分析范围，例如仅分析重音位置的元音或双元音中的第一个元音。所有分析结果以CSV格式输出，便于进一步研究和应用。

背景与挑战

背景概述

liederCorpus数据集是由David Lonowski、Jordan Pyle、Stephen Rodgers、Kris Shaffer和Leigh VanHandel等研究人员共同发起的Lieder Project的成果。该项目始于2015年，旨在构建一个包含19世纪德国艺术歌曲诗歌及其国际音标（IPA）转录的语料库。该数据集的核心研究问题是通过对诗歌的音韵特征进行分析，揭示音乐与文本之间的关系，进而为音乐学、语言学以及诗歌研究提供数据支持。数据集不仅包含诗歌文本和IPA转录，还提供了用于自动翻译和分析的Python脚本，极大地推动了跨学科研究的进展。该项目的开源性和协作性使其在音乐与语言交叉领域具有广泛的影响力。

当前挑战

liederCorpus数据集在构建过程中面临多重挑战。首先，诗歌的IPA转录需要高度的语言学专业知识，尤其是在处理德语诗歌中的复杂音韵结构时，确保转录的准确性成为一大难题。其次，数据集的自动化分析工具依赖于Python和R脚本，这些脚本的开发与调试需要兼顾算法的效率与结果的可靠性。此外，数据集的扩展性也是一个挑战，尽管项目鼓励外部贡献，但如何确保新增数据的质量与一致性仍需进一步解决。最后，数据集的长期保存与版本控制依赖于GitHub平台，如何在不同研究团队之间实现高效协作与数据同步也是项目持续发展的关键问题。

常用场景

经典使用场景

liederCorpus数据集在音乐学和语言学研究中具有重要应用，特别是在分析19世纪德国艺术歌曲的诗歌文本及其国际音标（IPA）转录方面。研究者可以利用该数据集中的诗歌文本和IPA转录，深入探讨德语诗歌的语音特征及其与音乐旋律的关联。通过Python脚本分析诗歌中的元音分布，数据集为研究德语诗歌的韵律结构和语音模式提供了丰富的素材。

衍生相关工作

liederCorpus数据集衍生了许多相关研究，尤其是在音乐信息检索和语音分析领域。基于该数据集，研究者开发了多种分析工具，如Python脚本和R脚本，用于分析诗歌的语音特征和音乐结构。此外，数据集还促进了跨学科合作，推动了音乐学、语言学和计算机科学的交叉研究。一些经典工作包括利用数据集进行德语诗歌的韵律分析，以及开发自动化的IPA转录工具，进一步扩展了数据集的应用范围。

数据集最近研究