02_PoS
收藏DataCite Commons2023-02-12 更新2025-04-09 收录
下载链接:
https://hdl.handle.net/21.11113/0000-000F-811F-D
下载链接
链接失效反馈官方服务:
资源简介:
Dieser Ordner enthält die lemmatisierten Texte mit Part-of-Speech-Annotationen. Für die Annotation wurde die Open-Source-Software TreeTagger genutzt, die von Helmut Schmid im TC-Projekt des Instituts für Computerlinguistik der Universität Stuttgart entwickelt wurde. Das Tool sowie Parameter für zahlreiche Sprachen stehen u. a. auf der Webseite des Centrums für Informations- und Sprachverarbeitung der LMU München zur Verfügung: https:// www.cis.uni-muenchen.de/~schmid/tools/TreeTagger/ [Letzter Zugriff am 16.01.2023]. Die Dateien wurden auf zehn Subkorpora aufgeteilt, die sich jeweils einem Sprecher und einem historischen Abschnitt zuordnen lassen (Aufteilung am Ende der README-Datei).
提供机构:
DARIAH-DE
创建时间:
2023-02-12



