five

DiBiLit-Korpus

收藏
NIAID Data Ecosystem2026-03-13 收录
下载链接:
https://zenodo.org/record/5526297
下载链接
链接失效反馈
官方服务:
资源简介:
English: The DiBiLit corpus was created by homogenising various derivatives of texts from the »Digital Library« – originally published by DirectMedia Publishing – and extensively enriching them with (bibliographic) metadata within the collaborative project CLARIAH-DE at the BBAW. The more than 2,000 texts come from renowned authors, are DTABf-encoded and were made accessible under a CC-BY-SA 4.0 license within the DTA infrastructure. Thus, the text collection can be researched using the DDC search engine integrated in the DTA as well as other DTA tools for linguistic analysis. Further tools/services for text analysis are available, for instance via the link to the Language Resource Switchboard (LRS). German: Das DiBiLit-Korpus entstand durch die Homogenisierung verschiedener Derivate von Texten aus der »Digitalen Bibliothek« – ursprünglich von DirectMedia Publishing veröffentlicht – sowie die umfängliche Anreicherung durch (bibliographische) Metadaten im Rahmen des Verbundprojekts CLARIAH-DE an der BBAW . Die mehr als 2.000 Texte stammen von namhaften Autorinnen und Autoren, sie sind DTABf-kodiert und wurden innerhalb der DTA-Infrastruktur unter einer CC BY-SA 4.0 Lizenz zugänglich gemacht. So kann die Textsammlung mittels der im DTA integrierten DDC-Suchmaschine sowie weiterer DTA-Werkzeuge zur linguistischen Analyse beforscht werden. Weitere Werkzeuge/Dienste zur Textanalyse stehen über die Verknüpfung bspw. mit dem Language Ressource Switchboard (LRS) zur Verfügung.
创建时间:
2021-12-18
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作