Markenkunde.de

…Blog rund ums Thema Marketing
  • rss
  • Start
  • Branding
  • eBusiness
  • Fokus: Kunde
  • Marketing: A-Z
  • Marktforschung
  • Studien & Links
  • Tools

Explorative Analyse von Korrelationstabellen aus SPSS / PASW

admin | 2. Januar 2010

Gerne verschafft man sich über Korrelationstabellen einen Überblick, welche Variablen wie aufeinander wirken könnten, um nach Hinweisen für kausale Zusammenhänge oder Einflussfaktoren zu suchen. Möchte man nun in SPSS einfach mal „auf gut Glück“ eine große Menge an Variablen gegenüberstellen, so merkt man schnell, dass man aus dieser Tabelle so erstmal nicht wirklich schlau wird. Grund: Die Tabelle ist schnell viel zu groß, man verliert schnell den Überblick, in welcher Zeile oder Spalte man sich gerade befindet. Außerdem werden Größen wie die Irrtumswahrscheinlichkeit („Signifikanz“) und das N auch gleich standardmäßig mit ausgegeben. Diese Größen sind ja meist erst dann interessant, wenn man eine Auffälligkeit gefunden hat. Vor lauter Zahlen wird einem also erstmal nicht ersichtlich, was denn nun eigentlich interessant sein könnte, und was nicht.

Möchte man das ganze in Excel kopieren, so bemerkt man schnell, dass die Tabellen schlecht formatiert werden – viele Zahlen werden als Potenzen dargestellt, und die Formatierung lässt auch zu wünschen übrig. SPSS-Tabellen sinnvoll und einfach zu formatieren, ist leider auch noch ein Traum.

Grund genug, sich mal Gedanken zu machen, wie man dieses Problem mit ein paar wenigen Griffen lösen könnte. Dies habe ich gemacht, und dabei eine recht einfache und praktikable Lösung gefunden. Trotz all dem sollte man allerdings immer beachten, dass eine Korrelation nicht zwangsläufig auch kausal ist - einen cum hoc ergo propter hoc sollte man also zwainglichst vermeiden ;-)

Hier gibts die Anleitung dazu (pdf)
…und hier nochmal das Beispiel-Excelfile (.xls)

Weitere Links zum Thema:
Korrelationskoeffizienten vergleichen (Tool)
Mittlere Korrelationskoeffizienten berechnen (Tool)

Kommentare
1 Kommentar »
Kategorien
Marktforschung, Tools
Tags
Excel, explorative datenanalyse, kausalität, Korrelation, Korrelationstabelle, korrleationskoeffizient, PASW, SPSS, spss tabelle formatieren, SPSS Tricks
RSS Kommentare RSS Kommentare
Trackback Trackback

Kleines Tool - mittlere Korrelationskoeffizienten berechnen

admin | 22. August 2009

Oft benötigt man bei Kundenzufriedenheitsstuden bzw. Treiberanalysen Mittelwerte von Korrelationskoeffizienten, um eine Idee zu bekommen, wo man die Felder einer “Zufriedenheitstreiber-Matrix” oder Ähnlichem trennt. Dazu gibt es mehrere Möglichkeiten, von “pi mal Daumen - hier siehts ganz gut aus” über “Koeffizienten addieren und durch die Anzahl der Koeffizienten teilen”, usw… Aber es gibt auch noch eine analytisch-richtige Möglichkeit ;-)

Nach dem selben Schema, wie man Korrleationskoeffizienten vergleicht, berechnet man auch die Mittelwerte:
1. Schritt: Transformation in Fisher’s-Z-Werte
2. Schritt: Berechnung des arithmetischen Mittels der Fisher’s-Z-Werte
3. Schritt: Re-Transformation des mittleren Fisher’s-Z-Wertes

fertig ;-)

Da das immer sehr viel Mühe ist, hier mal ein kleines Excel-Tool, dass das für einen übernimmt. Mathematisch nichts weltbewegendes, aber doch ganz praktisch wenns schnell gehen muss… Einfach die Korrelationskoeffizienten in die grauen Felder eingeben (müsste genügend Platz sein), in der Tabelle oben gibt’s dann automatisch das “echte” Ergebnis (in fett). Zum “Nochmal-Nachlesen” bietet sich bspw. Bortz - Statistik für Human- und Sozialwissenschaftler (6. Auflage, 2004), S. 219 an.

WICHTIG!
Wenn mit weniger Koeffizienten Koeffizienten gerechnet wird (also nicht alle grauen Felder ausgefüllt sind), bezieht der “errechnete, echte Mittelwert” trotzdem alle Z-Werte mit ein. Die Z-Werte neben leeren Felder muss man also einfach noch schnell manuell rauslöschen (Wert: 0,000). Wird bald mal irgendwie geändert, sodass keine manuellen Eingriffe mehr nötig sind!

Viel Spaß!

LINK ZUM DOWNLOAD:
Tool zur Mittelwertberechnung von Korrelationskoeffizienten (.xls)

Kommentare
Keine Kommentare »
Kategorien
Tools
Tags
berechnen, Excel, Korrelationskoeffizient, Marketing-Tool, Mittelwert, statistik, Tool
RSS Kommentare RSS Kommentare
Trackback Trackback

Fälle gewichten in SPSS – Einblicke in das Tool (Teil 2)

admin | 19. August 2009

Nachdem ich kürzlich den ersten Beitrag in der Rubrik Marketing-Tools geschrieben habe, und damit auch das Thema der Fallgewichtung in SPSS angesprochen habe, möchte ich nun anhand einer einfachen Version vorstellen. Ist antürlich so noch nicht vollständig und aussagekräftig, dafür beschreibt es aber mal ganz einfach die Art und Weise, wie man Excel zum Generieren von SPSS-Syntaxen nutzen kann, und wie ein einfacher Gewichtungssyntax aussehen kann.

Der Hintergrund ist recht einfach: In der Mappe “Konfiguration” gibt man ein, wie die Grundgesamtheit aussieht, wie die Geschlechtsvariable heißt, und welche Ausprägung für männlich und welche für weiblich steht. Diese Daten sind über “Verketten-Funktionen” miteinander verknüpft und ergeben einen Syntax - in der 2. Mappe “Datensatz_analysieren”. Diesen kopiert man in SPSS, startet ihn ([STRG] + [R]) und erhält als Ergebnis eine Häufigkeitstabelle. Diese kopiert man aus dem SPSS-Output wieder in das Excelfile, und zwar genau an die rot markierte Stelle in der gleichen Mappe. Nun hat man die “Soll-Daten” (eigene Eingabe) und die “Ist-Daten” (aus dem Datensatz). Diese Ergeben in Relation zueinander die Gewichte. Diese werden nun berechnet und ebenfalls über Verketten-Funktionen gleich in einen neuen Syntax eingebettet, der eure Datei dann auch gewichtet - in der letzten Mapp “Gewichtung”. An Euren Rohdaten ändert das Tool nichts, es werden lediglich zwei neue Variablen (wm_gend als einheitliche Geschlechtsvariable und vargew als Gewichtungsvariable) hinzugefügt.

Demnächst stelle ich eine Erweiterung des Tools online, bei der dann auch mehrere Gewichtungsvariablen, z.B. Alter, Geschlecht, Einkommen, Familienstand, usw… berücksichtigt werden.

LINK ZUM DOWNLOAD:
Tool: SPSS-Daten gewichten [Download, xls]

Kommentare
Keine Kommentare »
Kategorien
Marktforschung, Tools
Tags
automatisch, Excel, Fälle, Geschlecht, gewichten, SPSS, statistik, Tool, tricks
RSS Kommentare RSS Kommentare
Trackback Trackback

Fälle gewichten in SPSS – Grundlagen zum Tool (Teil 1)

admin | 6. August 2009

In den nächsten Tagen werde ich ein kleines Tool online stellen, welches die Gewichtung von Fällen in SPSS (PASW) bequem für einen durchführt. Somit sind nur noch ein paar Eingaben in eine Excelmaske nötig, und man bekommt einen fertigen Syntax, der die SPSS-Daten gewichtet.
Bevor ich das Tool online stelle, erstmal ein paar Grundlagen, insbesondere:

  • Wie können nicht-repräsentative Daten repräsentativ gemacht werden?
  • Wie werden Gewichte berechnet?
  • Wie können Gewichtungsvariablen in SPSS eingefügt werden?
  • Wie kommt man an Daten, die die relevante Grundgesamtheit repräsentieren?

Besonders bei semiprofessionellen Onlinebefragungen oder empirischen Studienarbeiten hat man oft nicht die Möglichkeit oder die Zeit, seine Daten mittels eines Quotenverfahrens repräsentativ zu gestalten. Dazu kommt, dass man im Vornherein auch nur schlecht beurteilen kann, welche Datensätze bei der Datenbereinigung aus der Datenanalyse wieder ausgeschlossen werden. Summa Summarum – oft entsprechen die Daten nicht der relevanten Grundgesamtheit. Was also bietet sich an, um „nicht-repräsentative Daten“ zumindest annähernd zu repräsentativieren? Das Zauberwort heißt „Gewichtung“ und geht mit SPSS recht einfach. Der Grundgedanke der Gewichtung ist, dass unterrepräsentierte Fälle (also Antworten von Personen, die nach ihren betrachteten Merkmalen „zu wenig“ in der Stichprobe vorhanden sind) stärker in die Ergebnisse mit Einfließen, als überrepräsentierte Fälle.

Beträgt das Verhältnis von Männern zu Frauen in der Grundgesamtheit 1:1 (d.h. 50 Prozent Männer und 50 Prozent Frauen), in der Stichprobe wäre die aber anders (z.B. 25% Männer und 75% Frauen), so müssten die Antworten der Männer für die folgenden Analysen stärker gewichtet werden, als die der Frauen.
Die Gewichte berechnen sich, indem man den Sollwert (hier: 50%) durch den Istwert dividiert, d.h.

Wm = 0,50 / 0,25 = 2,000
Wf = 0,5 / 0,75 = 0,667

Nun müsste man also im Datensatz eine neue Variable (hier: „weight_1“) einfügen, nach welcher die Fälle gewichtet werden. Bei den Männern würde also überall der Wert 2,000 drinstehen, bei den Frauen 0,667. Manuell ist die Eingabe dazu wohl etwas schwierig, also bietet sich hierzu en Syntax an. Für die Geschlechtvariable „V_geschl“ (hier: männlich = 0, weiblich = 1) würde der Syntax lautet:

If (V_geschl = 0) weight_1 = 2 .
If (V_geschl = 1) weight_1 = 0,667 .

Achtung, je nach SPSS-Version & Einstellung kann sein, dass Dezimalstellen durch Punkte ersetzt werden müssen!

Nun wurde die neue Variable ausgefüllt (Auf Sonderfälle mit Missings, etc gehe ich diesmal noch nicht ein). Damit die Fälle nun auch gewichtet werden, kann man entweder über das Menü, oder aber wieder bequem über den Syntax die Fälle gewichten:

Weight by weight_1 .

Et Voilà, nun ist der Datensatz nach dem Geschlecht gewichtet! Das alleine reicht aber noch nicht aus, schließlich könnte es ja sein, dass bei den 75 Frauen die Hälfte unter 20 Jahren alt ist, diese in der Grundgesamtheit aber gleichverteilt sind. Auf die Gewichtung mit mehreren Kriterien gehe ich im nächsten Beitrag ein. Genauso ist die Problematik, dass man oft bei „persönlichen“ Daten wie Alter, Einkommen und Beruf viele fehlende Werte bekommt (sog. Missing Values), welche bei der Gewichtung auch nochmals separat berücksichtigt werden müssen.

Natürlich sollte man sich im Vornherein überlegen, ob die Gewichtung überhaupt Sinn macht. Spontan fallen mir 2 Kriterien ein, nach denen man das entscheiden könnte:
a) Macht die Gewichtung inhaltlich Sinn?
Ist das Ziel einer Erhebung, Zusammenhänge zu ermitteln (bspw. Korrelationskoeffizienten), so ist es fraglich, ob man wirklich eine Gewichtung benötigt. Geht es aber darum, eine „allgemeine Meinung“ zu bekommen, sieht das ganze natürlich schon wieder anders aus.
b) Ist die Gewichtung pragmatisch?
In diesem Fall macht es Sinn, erstmal „spaßeshalber“ eine Gewichtung durchzuführen und zu analysieren, in wiefern sich die gewichteten Ergebnisse von den ungewichteten unterscheiden. Ist das nur marginal, ist natürlich fraglich, ob der zusätzliche Erklärungsbedarf (nach welchen Kriterien wurde warum und mit welchen Daten wie gewichtet?) den zusätzlichen Nutzen gerechtfertigt. Aber genauso sollte man sich auch die Werte der Gewichte anschauen: Es gibt eine Faustregel, dass die Gewichte möglichst nicht kleiner als 0,3, und möglichst nicht größer als 3,0 sein sollten.

Und woher bekommt man Daten über die Grundgesamtheit? Nunja, das hängt immer stark vom jeweiligen Analysegegenstand ab. Bevölkerungsrepräsentative Daten bzgl. der Randverteilung erhält man bspw. aus dem Mikrozensus. Das ist eine regelmäßig vom Statistischen Bundesamt durchgeführte „Pflichtbefragung“ (die zufällig ausgewählten Personen sind verpflichtet, an der Befragung teilzunehmen). Aber auch andere „große“ Befragungen können Hinweise geben, z.B. das Stern Marken Profile, TDW, etcÉ

Entspricht die relevante Grundgesamtheit nicht der deutschen Bevölkerung, sondern einer anderen Zielgruppe, so müssen andere Basisdaten herangezogen werden, zum Beispiel:
Grundgesamtheit der Internetnutzer: (N)onliner-Atlas, AGOF Internet Facts

    Grundgesamtheit einer Universität: Hochschulinterne Statistiken
    Grundgesamtheit der Kunden bei einer Kundenbefragung bei registrierten Kunden: Kundendatenbank
    Grundgesamtheit der Kunden bei einer Kundenbefragung bei nicht registrierten Kunden, z.B. in einem Geschäft: Beobachtung der Kundenströme, z.B. Geschlecht, grobe Altersschätzung, KFZ-Ortskennzeichen, etc
Kommentare
Keine Kommentare »
Kategorien
Tools
Tags
Excel, Gewichtung, marktforschung, SPSS, statistik, Tool
RSS Kommentare RSS Kommentare
Trackback Trackback

Allgemeines

    Impressum
    Über mich
    Marketing Blogs
    NEU!!! CorrComparer 1.0

Tags

automatisch brand Branding brand value CRM Definitionen Definition Social Media Event Excel Handel Handelslexikon Image imagepositionierung Kinder Korrelation Korrelationskoeffizient kostenlos kostenlose Kundenbindung LEH marke marken Markenimage markenpositionierung Marketing: A-Z Marketing: A-Z Marktdaten marktforschung marktstudie Metro parity PASW Ranking Service Social Media SPSS statistik Studie studien subsituierbare TK Tool tracking Trends web 2.0

Archiv

  • März 2010
  • Februar 2010
  • Januar 2010
  • Dezember 2009
  • November 2009
  • Oktober 2009
  • September 2009
  • August 2009
  • Juli 2009
  • Juni 2009
  • Mai 2009
  • April 2009
  • März 2009
  • Februar 2009
  • Januar 2009
rss RSS Kommentare valid xhtml 1.1 design by jide powered by Wordpress get firefox