five

Frauen* im Fokus. Transcriptions and full texts of letters and works of women's rights activists

收藏
Mendeley Data2024-05-20 更新2024-06-27 收录
下载链接:
https://zenodo.org/records/11038498
下载链接
链接失效反馈
官方服务:
资源简介:
In winter 2023/24 the Berlin State Library and Potsdam University (chair for Comparative Literature) organized the citizen science workshop "Frauen* im Fokus" (women* in focus). Within the project 48 participants transcribed 85 letters and documents by 19th- and early 20th-century women's rights activists held in the collections of the State Library. The transcriptions provided by the participants were aligned with the digital images of the items using the eScriptorium platform and software and checked for potential errors. From eScriptorium, the transcriptions were exported as ALTO and PAGE files. From the PAGE files, TEI/XML files were created with added metadata about the correspondence (where applicable). In addition to these MS sources, 55 printed works of the same activists were OCRed and are included in the dataset as PAGE and ALTO-files; these files were not manually checked for quality. We would like to thank our trainees Lilly Bucksteeg and Lilly Welz for their valuable contribution to the creation of the data set. The data set consists of five zip-files containing: the print sources in PAGE format the print sources in ALTO format the manuscript sources in PAGE format the manuscript sources in ALTO format the manuscript sources in TEI format ------------------ Im Wintersemester 2023/24 führten die Staatsbibliothek zu Berlin und die Universität Potsdam (Professur für Allgemeine und Vergleichende Literaturwissenschaft) das Projekt "Frauen* im Fokus" durch. Im Rahmen des Projekts transkribierten 48 Personen 85 Briefe und andere Nachlassdokumente von Frauenrechtlerinnen des 19. und frühen 20. Jahrhunderts. Das Organisationsteam nahm auf der Plattform eScriptorium eine teilweise automatisierte Layoutanalyse und Zeilensegmentierung der Digitalisate vor und fügte nach erfolgter inhaltlicher Qualitätskontrolle die von den Teilnehmenden erstellten Transkriptionen dort ein, um sie dann als PAGE- und ALTO-Dateien zu exportieren; zusätzlich wurden aus den PAGE-Dateien TEI-Dateien der einzelnen Dokumente generiert, die (wo passend) mit Brief-Metadaten zu Absendern, Empfängern und Orten angereichert wurden. Im Rahmen des Projekts wurden zudem 55 Druckwerke der Frauenrechtlerinnen aus dem Bestand der Staatsbibliothek als Volltexte erschlossen. Die Segmentierung und Volltexterkennung der Druckwerke erfolgte automatisch in eScriptorium ohne zusätzliche manuelle Qualitätskontrolle. Die Daten liegen exportiert in den Formaten PAGE und ALTO vor. Besonderer Dank gebührt Lilly Bucksteeg und Lilly Welz, die als Praktiantinnen im Projekt maßgeblich zur Erstellung des Datensets beigetragen haben. Das Datenset besteht aus fünf zip-Dateien die folgende Dateien enthalten: die gedruckten Werke im PAGE-Format die gedruckten Werke im ALTO-Format die Manuskript-Transkriptionen im PAGE-Format die Manuskript-Transkriptionen im ALTO-Format die Manuskript-Transkriptionen im TEI-Format
创建时间:
2024-05-16
二维码
社区交流群
二维码
科研交流群
商业服务