Reproduzierbare Textanalysen mit Topic Modeling
收藏PsychArchives2023-03-24 更新2026-04-25 收录
下载链接:
https://hdl.handle.net/20.500.12034/8154
下载链接
链接失效反馈官方服务:
资源简介:
Vortrag vom 02.11.2022 im Rahmen der Vortragsreihe "Practices and Tools of Open Science (PTOS)" Topic Modeling ist eine beliebte Text-Mining-Methode, um die zentralen Themen in großen Textsammlungen zu finden. Dabei ermittelt ein Algorithmus Gruppen von Wörtern, die in den Texten häufig gemeinsam vorkommen. Diese Wortgruppen werden als "Topics" bezeichnet. Da somit Textsammlungen beliebiger Größe automatisiert ausgewertet können, kann Topic Modeling ein aufschlussreiches Werkzeug für verschiedene textbasierte Anwendungen sein, etwa bei Social-Media-Studien oder in der Psychotherapieforschung. Auch wenn es sich bei Topic Modeling um ein Verfahren des "unsupervised machine learning" handelt, müssen viele Parameterentscheidungen von der analysierenden Person selbst getroffen werden. Da diese Entscheidungen starke Auswirkungen auf die Ergebnisse haben können und zum Teil auf Zufallszahlen beruhen, sind eine gute Dokumentation und frei verfügbarer Analyse-Code entscheidend für reproduzierbares Topic Modeling. In dieser einführenden Demonstration wird die etablierte Topic-Modeling-Variante "Latent Dirichlet Allocation" vorgestellt und auf einen frei verfügbaren Datensatz angewandt. Ein besonderer Schwerpunkt liegt auf Topic-Validität und Topic-Reliabilität – zwei oft übersehene, aber wichtige Modelleigenschaften. Anhand eines Beispiels wird gezeigt, wie die Analyse durch transparenten und detaillierten Code reproduzierbar wird. Außerdem wird eine kurze Einführung in PsychTopics (psychtopics.org) gegeben, das Open-Source-Tool des ZPID zur Erkundung psychologischer Forschungsthemen und -trends. Dabei werden mit Hilfe eines neuartigen Topic-Modeling-Ansatzes Themen in psychologischen Publikationen dynamisch identifiziert und in einer R Shiny App interaktiv dargestellt. https://leibniz-psychology.org/ptos/topic-modeling/ unknown
提供机构:
ZPID (Leibniz Institute for Psychology)
创建时间:
2023-03-24



