five

02_PoS

收藏
DataCite Commons2023-02-12 更新2025-04-09 收录
下载链接:
https://hdl.handle.net/21.11113/0000-000F-811F-D
下载链接
链接失效反馈
官方服务:
资源简介:
Dieser Ordner enthält die lemmatisierten Texte mit Part-of-Speech-Annotationen. Für die Annotation wurde die Open-Source-Software TreeTagger genutzt, die von Helmut Schmid im TC-Projekt des Instituts für Computerlinguistik der Universität Stuttgart entwickelt wurde. Das Tool sowie Parameter für zahlreiche Sprachen stehen u. a. auf der Webseite des Centrums für Informations- und Sprachverarbeitung der LMU München zur Verfügung: https:// www.cis.uni-muenchen.de/~schmid/tools/TreeTagger/ [Letzter Zugriff am 16.01.2023]. Die Dateien wurden auf zehn Subkorpora aufgeteilt, die sich jeweils einem Sprecher und einem historischen Abschnitt zuordnen lassen (Aufteilung am Ende der README-Datei).
提供机构:
DARIAH-DE
创建时间:
2023-02-12
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作