five

Der Einfluß von Klassifikationsverfahren, Stichprobengröße und strukturellen Datenmerkmalen auf die Klassifizierbarkeit von Variablen The Effect of Classification Method, Sample Size and Structural Features of the Data on Classifying Variables

收藏
PsychArchives2023-04-25 更新2026-04-25 收录
下载链接:
https://hdl.handle.net/20.500.12034/8238
下载链接
链接失效反馈
官方服务:
资源简介:
Die Eignung aufteilungsoptimierender, faktorenanalytischer und clusteranalytischer Verfahren für die Klassifikation von Variablen wurde in Abhängigkeit von drei Stichprobengrößen und strukturellen Datenmerkmalen untersucht. Jeweils 1000 Stichprobendatensätze mit 20 Variablen und 100, 150 sowie 200 Datenpunkten wurden gemäß der Merkmale von vier Populationsmustern generiert. Auf diese Stichprobendatensätze wurden vier aufteilungsoptimierende, sieben faktorenanalytische und acht clusteranalytische Verfahren angewendet, um eine Aufteilung der Variablen in disjunkte Klassen herbeizuführen. Anschließend wurde der Anteil populationsgemäßer Aufteilungen sowie die durchschnittlichen Ähnlichkeiten zwischen den ermittelten und den erwarteten Aufteilungen bestimmt. Die Ergebnisse zeigen, daß die erwarteten Aufteilungen mit einer zunehmenden Anzahl von Datenpunkten immer häufiger gefunden werden. Weiterhin wirken sich eine Erhöhung der Populationskorrelationen und Orthogonalität der zugrundeliegenden Dimensionen positiv auf die Aufteilungen aus. Es wird deutlich gemacht, unter welchen Bedingungen, bei welchen Stichprobengrößen und welchen Verfahren mit einer 90-prozentigen Sicherheit die populationsgemäße Aufteilung gefunden wird. Außerdem wird angezeigt, wann im Durchschnitt mit der Fehlzuordnung von weniger als einer Variablen zu rechnen ist. The appropriateness of allocation-optimizing, factor-analytic and cluster-analytic methods for classifying variables was investigated by taking three sample sizes and structural features of the data into consideration. One thousand datasets of 20 variables and of 100, 150 as well as 200 datapoints were generated according to the structural features of four population patterns. Four allocation-optimizing, seven factor-analytic and eight cluster-analytic methods were applied to this data for obtaining non-overlapping classes of variables. The results show that the rate of correct recoveries increases proportional to the amount of datapoints. Moreover, an increase in population correlations and orthogonal dimensions underlying the data improves the rate of correct recoveries. For each method and population pattern it is indicated when in at least 90 percent of the cases, the correct partition is obtained. It is also indicated when in average the mis-classification of less than one variable is to be expected. unknown publishedVersion
提供机构:
Pabst Science Publishers
创建时间:
2023-04-25
二维码
社区交流群
二维码
科研交流群
商业服务