Der Einfluß von Klassifikationsverfahren, Stichprobengröße und strukturellen Datenmerkmalen auf die Klassifizierbarkeit von Variablen The Effect of Classification Method, Sample Size and Structural Features of the Data on Classifying Variables

Name: Der Einfluß von Klassifikationsverfahren, Stichprobengröße und strukturellen Datenmerkmalen auf die Klassifizierbarkeit von Variablen The Effect of Classification Method, Sample Size and Structural Features of the Data on Classifying Variables
Creator: Pabst Science Publishers
Published: 2023-04-25 14:25:52
License: 暂无描述

PsychArchives2023-04-25 更新2026-04-25 收录

下载链接：

https://hdl.handle.net/20.500.12034/8238

下载链接

链接失效反馈

官方服务：

资源简介：

Die Eignung aufteilungsoptimierender, faktorenanalytischer und clusteranalytischer Verfahren für die Klassifikation von Variablen wurde in Abhängigkeit von drei Stichprobengrößen und strukturellen Datenmerkmalen untersucht. Jeweils 1000 Stichprobendatensätze mit 20 Variablen und 100, 150 sowie 200 Datenpunkten wurden gemäß der Merkmale von vier Populationsmustern generiert. Auf diese Stichprobendatensätze wurden vier aufteilungsoptimierende, sieben faktorenanalytische und acht clusteranalytische Verfahren angewendet, um eine Aufteilung der Variablen in disjunkte Klassen herbeizuführen. Anschließend wurde der Anteil populationsgemäßer Aufteilungen sowie die durchschnittlichen Ähnlichkeiten zwischen den ermittelten und den erwarteten Aufteilungen bestimmt. Die Ergebnisse zeigen, daß die erwarteten Aufteilungen mit einer zunehmenden Anzahl von Datenpunkten immer häufiger gefunden werden. Weiterhin wirken sich eine Erhöhung der Populationskorrelationen und Orthogonalität der zugrundeliegenden Dimensionen positiv auf die Aufteilungen aus. Es wird deutlich gemacht, unter welchen Bedingungen, bei welchen Stichprobengrößen und welchen Verfahren mit einer 90-prozentigen Sicherheit die populationsgemäße Aufteilung gefunden wird. Außerdem wird angezeigt, wann im Durchschnitt mit der Fehlzuordnung von weniger als einer Variablen zu rechnen ist. The appropriateness of allocation-optimizing, factor-analytic and cluster-analytic methods for classifying variables was investigated by taking three sample sizes and structural features of the data into consideration. One thousand datasets of 20 variables and of 100, 150 as well as 200 datapoints were generated according to the structural features of four population patterns. Four allocation-optimizing, seven factor-analytic and eight cluster-analytic methods were applied to this data for obtaining non-overlapping classes of variables. The results show that the rate of correct recoveries increases proportional to the amount of datapoints. Moreover, an increase in population correlations and orthogonal dimensions underlying the data improves the rate of correct recoveries. For each method and population pattern it is indicated when in at least 90 percent of the cases, the correct partition is obtained. It is also indicated when in average the mis-classification of less than one variable is to be expected. unknown publishedVersion

提供机构：

Pabst Science Publishers

创建时间：

2023-04-25