Korrelationskoeffizienten vergleichen und Mittelwerte berechnen
admin | 26. Februar 2009__________________________________
::::NACHTRAG:::
HIER GEHTS ZUM TOOL CorrComparer!
________________________________
Sicherlich ging es nicht nur mir bisher so, dass man sich bei verschiedenen Korrelationskoeffizienten in verschiedenen Modellen gefragt hat: Sind die Unterschiede zwischen zwei Korrleationskoeffizienten signifikant unterschiedlich? Ist der Einfluss von A auf B in der Gruppe X größer als in der Gruppe Y? Nachdem ich erstmal bei google nur auf Foren mit der Frage “Wie kann ich die vergleichen?” und meist keinen Antworten kam, fand ich dann doch eine einfache Lösung. Zuerst müssen die Korrelationskoeffizienten einer Fisher’s Z-Transformation unterzogen werden. Begründet ist das dadurch, dass diese Z-Werte, zumindest bei hohem N, annähernd normalverteilt sind. Auf Basis der Z-Werte wird dann die folgende Prüfgröße berechnet:
z = (Zf1 - Zf2) / Wurzel( 1/(N1-3) + 1/(N2-3) )
wobei ZF1 und ZF2 die Fishers-Z-Werte sind:
Zf = 1/2 * ln( (1+R) / (1-R) )
Hier ein Link, der einem den Vergleich sofort übernimmt:
H0: RX = RY
H1: RX =! RY
http://www.fon.hum.uva.nl/Service/Statistics/Two_Correlations.html
Der erste Eindruck scheint erstmal etwas verwirrend zu sein. “Wieso gibt es keine Prüfgröße in die man die Korrelationskoeffizienten einfach einsett? Wieso nicht einfach irgendwie nebeneienanderlegen und wie Mittelwerte betrachten o.Ä?” Der Grund liegt in den Koeffizienten selber: Korrelationskoeffizienten sind keine Kardinalszahlen, sprich: Die Mittelwerte und Varianzen von mehreren Korrelationskoeffizienten sind nicht vergleichbar.
Diese Berechnungsformel dazu habe ich ja oben bereits genannt, steht aber auch in jedem guten Statistikbuch, z.B. Bortz (2006), S.221.
Konkret bedeutet das, dass ich bspw. auch einen Mittelwert zweier Korrelationskoeffizienten nicht ohne einer Fisher’s-Z-Transformation berechnen kann. Zuerst muss auch hier müssen auch hier die Korrelationskoeffizienten in Fishers-Z-Werte transformieren werden. dann wird davon der Mittelwert berechnet, und dieset dann wieder “entfishert”.
Interessant ist dabei zum Beispiel, dass große Korrelationskoeffizenten einen stärkeren Einfluss haben als kleine. So ist der Z-Wert von r1=0,4 bspw. Z1=0,42, und der von r2=0,8 beträgt Z2=1,10. Also, ein r von 0,8 ist nicht doppelt, sondern sogar fast 3x so groß wie ein r von 0,4. (das Beispiel stammt übrigens auch aus Bortz 2006 S.221) .
(achso… trotzdem sollte man nicht vergessen wie außreißersensibel Korrelationskoeffizienten sind… besonders bei Eingabefehlern von Paper-Pencil-Fragebögen…. Im Scatterplot übereinanderlegen und dann diskutieren ist erstmal sinnvoller als gleich wie wild rumrechnen und irgendwelche falschen Schlüsse ziehen oder Theorien zu verwerfen
::::NACHTRAG:::





