Markenkunde.de

…Blog rund ums Thema Marketing
  • rss
  • Home
  • Branding
  • eBusiness
  • Fokus: Kunde
  • Marketing: A-Z
  • Marktforschung
  • Studien & Links
  • Tools

Explorative Analyse von Korrelationstabellen aus SPSS / PASW

admin | 2. Januar 2010

Gerne verschafft man sich über Korrelationstabellen einen Überblick, welche Variablen wie aufeinander wirken könnten, um nach Hinweisen für kausale Zusammenhänge oder Einflussfaktoren zu suchen. Möchte man nun in SPSS einfach mal „auf gut Glück“ eine große Menge an Variablen gegenüberstellen, so merkt man schnell, dass man aus dieser Tabelle so erstmal nicht wirklich schlau wird. Grund: Die Tabelle ist schnell viel zu groß, man verliert schnell den Überblick, in welcher Zeile oder Spalte man sich gerade befindet. Außerdem werden Größen wie die Irrtumswahrscheinlichkeit („Signifikanz“) und das N auch gleich standardmäßig mit ausgegeben. Diese Größen sind ja meist erst dann interessant, wenn man eine Auffälligkeit gefunden hat. Vor lauter Zahlen wird einem also erstmal nicht ersichtlich, was denn nun eigentlich interessant sein könnte, und was nicht.

Möchte man das ganze in Excel kopieren, so bemerkt man schnell, dass die Tabellen schlecht formatiert werden – viele Zahlen werden als Potenzen dargestellt, und die Formatierung lässt auch zu wünschen übrig. SPSS-Tabellen sinnvoll und einfach zu formatieren, ist leider auch noch ein Traum.

Grund genug, sich mal Gedanken zu machen, wie man dieses Problem mit ein paar wenigen Griffen lösen könnte. Dies habe ich gemacht, und dabei eine recht einfache und praktikable Lösung gefunden. Trotz all dem sollte man allerdings immer beachten, dass eine Korrelation nicht zwangsläufig auch kausal ist - einen cum hoc ergo propter hoc sollte man also zwainglichst vermeiden ;-)

Hier gibts die Anleitung dazu (pdf)
…und hier nochmal das Beispiel-Excelfile (.xls)

Weitere Links zum Thema:
Korrelationskoeffizienten vergleichen (Tool)
Mittlere Korrelationskoeffizienten berechnen (Tool)

Kommentare
1 Kommentar »
Kategorien
Marktforschung, Tools
Tags
Excel, explorative datenanalyse, kausalität, Korrelation, Korrelationstabelle, korrleationskoeffizient, PASW, SPSS, spss tabelle formatieren, SPSS Tricks
RSS Kommentare RSS Kommentare
Trackback Trackback

Einwohnerzahlen einer SPSS-Datei hinzufügen in 10 Minuten

admin | 5. September 2009

Heute habe ich mich mal wieder mit einer SPSS-Problematik auseinandergesetzt und ziemlich schnell eine ziemlich brauchbare Lösung gefunden. Diese möchte ich natürlich niemandem vorenthalten! Um es vorweg zu nehmen: Die geliebte VERKETTEN-Funktion, wie ich sie auch schon zum Gewichten von Fällen vorgestellt habe, hat mal wieder geholfen!

Es ging um die Wirkung von Shoppingcenter auf die Innenstädte (ähnlich wie es z.B. in dieser Studie der DIFU mehr oder weniger valide gemacht wurde - siehe hierzu auch diese Reaktion (S. 11) auf die Studie). Nun kamen wir auf die Idee, die Einwohnerzahlen der Städte dazuzuführen, um diese als weitere Variable in unsere Analysen mit einzubeziehen. Nur wie, wenn man unter Zeitdruck steht? 150 Städte recherchieren und von Hand eintragen? Nein, dauert viel zu lange!

Das einzige, was wir in unserer Datenbasis hatten, war die Variable “Stadt”, allerdings keine Einwohnerzahlen dazu. Also brauchten wir irgendeine Tabelle, die den Stadtnamen mit den Einwohnerzahlen in Verbindung bringt. Nur woher? Google. Also kurz nach Einwohnerzahl und ein paar Städten, mit der Einschränkung auf Excel-Files gegoogelt. dieses erste Suchergebnis von der DIHK mit Bezug auf das Statistische Bundesamt gezogen, die einzelnen Folder schnell in einen kopiert und daraus aus einer VERKETTEN-Funktion einen Syntax gebastelt. Okay, dabei handelte es sich um eine Datei mit Gewerbesteuer-Hebesätzen, aber das war ja erstmal egal (die könnten wir also auch noch dazufügen wenn wir wollten :D ). Noch ein paar Städte manuell ergänzt, ein bisschen an Bezeichungen gefeilscht damit sie von der Schreibweise unserer SPSS-Basisdatei entsprachen und den Syntax drüberlaufen lassen.

Dauer: weniger als 15 Minuten.

Fazit:
Google + Verkettenfunktionen = Zeitersparnis!

… So sieht der Syntax übrigens nun aus.

Kommentare
Keine Kommentare »
Kategorien
Tools
Tags
automatisch, destatis, einwohnerzahlen, SPSS, syntax
RSS Kommentare RSS Kommentare
Trackback Trackback

Fälle gewichten in SPSS – Einblicke in das Tool (Teil 2)

admin | 19. August 2009

Nachdem ich kürzlich den ersten Beitrag in der Rubrik Marketing-Tools geschrieben habe, und damit auch das Thema der Fallgewichtung in SPSS angesprochen habe, möchte ich nun anhand einer einfachen Version vorstellen. Ist antürlich so noch nicht vollständig und aussagekräftig, dafür beschreibt es aber mal ganz einfach die Art und Weise, wie man Excel zum Generieren von SPSS-Syntaxen nutzen kann, und wie ein einfacher Gewichtungssyntax aussehen kann.

Der Hintergrund ist recht einfach: In der Mappe “Konfiguration” gibt man ein, wie die Grundgesamtheit aussieht, wie die Geschlechtsvariable heißt, und welche Ausprägung für männlich und welche für weiblich steht. Diese Daten sind über “Verketten-Funktionen” miteinander verknüpft und ergeben einen Syntax - in der 2. Mappe “Datensatz_analysieren”. Diesen kopiert man in SPSS, startet ihn ([STRG] + [R]) und erhält als Ergebnis eine Häufigkeitstabelle. Diese kopiert man aus dem SPSS-Output wieder in das Excelfile, und zwar genau an die rot markierte Stelle in der gleichen Mappe. Nun hat man die “Soll-Daten” (eigene Eingabe) und die “Ist-Daten” (aus dem Datensatz). Diese Ergeben in Relation zueinander die Gewichte. Diese werden nun berechnet und ebenfalls über Verketten-Funktionen gleich in einen neuen Syntax eingebettet, der eure Datei dann auch gewichtet - in der letzten Mapp “Gewichtung”. An Euren Rohdaten ändert das Tool nichts, es werden lediglich zwei neue Variablen (wm_gend als einheitliche Geschlechtsvariable und vargew als Gewichtungsvariable) hinzugefügt.

Demnächst stelle ich eine Erweiterung des Tools online, bei der dann auch mehrere Gewichtungsvariablen, z.B. Alter, Geschlecht, Einkommen, Familienstand, usw… berücksichtigt werden.

LINK ZUM DOWNLOAD:
Tool: SPSS-Daten gewichten [Download, xls]

Kommentare
1 Kommentar »
Kategorien
Marktforschung, Tools
Tags
automatisch, Excel, Fälle, Geschlecht, gewichten, SPSS, statistik, Tool, tricks
RSS Kommentare RSS Kommentare
Trackback Trackback

Fälle gewichten in SPSS – Grundlagen zum Tool (Teil 1)

admin | 6. August 2009

In den nächsten Tagen werde ich ein kleines Tool online stellen, welches die Gewichtung von Fällen in SPSS (PASW) bequem für einen durchführt. Somit sind nur noch ein paar Eingaben in eine Excelmaske nötig, und man bekommt einen fertigen Syntax, der die SPSS-Daten gewichtet.
Bevor ich das Tool online stelle, erstmal ein paar Grundlagen, insbesondere:

  • Wie können nicht-repräsentative Daten repräsentativ gemacht werden?
  • Wie werden Gewichte berechnet?
  • Wie können Gewichtungsvariablen in SPSS eingefügt werden?
  • Wie kommt man an Daten, die die relevante Grundgesamtheit repräsentieren?

Besonders bei semiprofessionellen Onlinebefragungen oder empirischen Studienarbeiten hat man oft nicht die Möglichkeit oder die Zeit, seine Daten mittels eines Quotenverfahrens repräsentativ zu gestalten. Dazu kommt, dass man im Vornherein auch nur schlecht beurteilen kann, welche Datensätze bei der Datenbereinigung aus der Datenanalyse wieder ausgeschlossen werden. Summa Summarum – oft entsprechen die Daten nicht der relevanten Grundgesamtheit. Was also bietet sich an, um „nicht-repräsentative Daten“ zumindest annähernd zu repräsentativieren? Das Zauberwort heißt „Gewichtung“ und geht mit SPSS recht einfach. Der Grundgedanke der Gewichtung ist, dass unterrepräsentierte Fälle (also Antworten von Personen, die nach ihren betrachteten Merkmalen „zu wenig“ in der Stichprobe vorhanden sind) stärker in die Ergebnisse mit Einfließen, als überrepräsentierte Fälle.

Beträgt das Verhältnis von Männern zu Frauen in der Grundgesamtheit 1:1 (d.h. 50 Prozent Männer und 50 Prozent Frauen), in der Stichprobe wäre die aber anders (z.B. 25% Männer und 75% Frauen), so müssten die Antworten der Männer für die folgenden Analysen stärker gewichtet werden, als die der Frauen.
Die Gewichte berechnen sich, indem man den Sollwert (hier: 50%) durch den Istwert dividiert, d.h.

Wm = 0,50 / 0,25 = 2,000
Wf = 0,5 / 0,75 = 0,667

Nun müsste man also im Datensatz eine neue Variable (hier: „weight_1“) einfügen, nach welcher die Fälle gewichtet werden. Bei den Männern würde also überall der Wert 2,000 drinstehen, bei den Frauen 0,667. Manuell ist die Eingabe dazu wohl etwas schwierig, also bietet sich hierzu en Syntax an. Für die Geschlechtvariable „V_geschl“ (hier: männlich = 0, weiblich = 1) würde der Syntax lautet:

If (V_geschl = 0) weight_1 = 2 .
If (V_geschl = 1) weight_1 = 0,667 .

Achtung, je nach SPSS-Version & Einstellung kann sein, dass Dezimalstellen durch Punkte ersetzt werden müssen!

Nun wurde die neue Variable ausgefüllt (Auf Sonderfälle mit Missings, etc gehe ich diesmal noch nicht ein). Damit die Fälle nun auch gewichtet werden, kann man entweder über das Menü, oder aber wieder bequem über den Syntax die Fälle gewichten:

Weight by weight_1 .

Et VoilÃÊ, nun ist der Datensatz nach dem Geschlecht gewichtet! Das alleine reicht aber noch nicht aus, schließlich könnte es ja sein, dass bei den 75 Frauen die Hälfte unter 20 Jahren alt ist, diese in der Grundgesamtheit aber gleichverteilt sind. Auf die Gewichtung mit mehreren Kriterien gehe ich im nächsten Beitrag ein. Genauso ist die Problematik, dass man oft bei „persönlichen“ Daten wie Alter, Einkommen und Beruf viele fehlende Werte bekommt (sog. Missing Values), welche bei der Gewichtung auch nochmals separat berücksichtigt werden müssen.

Natürlich sollte man sich im Vornherein überlegen, ob die Gewichtung überhaupt Sinn macht. Spontan fallen mir 2 Kriterien ein, nach denen man das entscheiden könnte:
a) Macht die Gewichtung inhaltlich Sinn?
Ist das Ziel einer Erhebung, Zusammenhänge zu ermitteln (bspw. Korrelationskoeffizienten), so ist es fraglich, ob man wirklich eine Gewichtung benötigt. Geht es aber darum, eine „allgemeine Meinung“ zu bekommen, sieht das ganze natürlich schon wieder anders aus.
b) Ist die Gewichtung pragmatisch?
In diesem Fall macht es Sinn, erstmal „spaßeshalber“ eine Gewichtung durchzuführen und zu analysieren, in wiefern sich die gewichteten Ergebnisse von den ungewichteten unterscheiden. Ist das nur marginal, ist natürlich fraglich, ob der zusätzliche Erklärungsbedarf (nach welchen Kriterien wurde warum und mit welchen Daten wie gewichtet?) den zusätzlichen Nutzen gerechtfertigt. Aber genauso sollte man sich auch die Werte der Gewichte anschauen: Es gibt eine Faustregel, dass die Gewichte möglichst nicht kleiner als 0,3, und möglichst nicht größer als 3,0 sein sollten.

Und woher bekommt man Daten über die Grundgesamtheit? Nunja, das hängt immer stark vom jeweiligen Analysegegenstand ab. Bevölkerungsrepräsentative Daten bzgl. der Randverteilung erhält man bspw. aus dem Mikrozensus. Das ist eine regelmäßig vom Statistischen Bundesamt durchgeführte „Pflichtbefragung“ (die zufällig ausgewählten Personen sind verpflichtet, an der Befragung teilzunehmen). Aber auch andere „große“ Befragungen können Hinweise geben, z.B. das Stern Marken Profile, TDW, etc…

Entspricht die relevante Grundgesamtheit nicht der deutschen Bevölkerung, sondern einer anderen Zielgruppe, so müssen andere Basisdaten herangezogen werden, zum Beispiel:
Grundgesamtheit der Internetnutzer: (N)onliner-Atlas, AGOF Internet Facts

    Grundgesamtheit einer Universität: Hochschulinterne Statistiken
    Grundgesamtheit der Kunden bei einer Kundenbefragung bei registrierten Kunden: Kundendatenbank
    Grundgesamtheit der Kunden bei einer Kundenbefragung bei nicht registrierten Kunden, z.B. in einem Geschäft: Beobachtung der Kundenströme, z.B. Geschlecht, grobe Altersschätzung, KFZ-Ortskennzeichen, etc
Kommentare
Keine Kommentare »
Kategorien
Tools
Tags
Excel, Gewichtung, marktforschung, SPSS, statistik, Tool
RSS Kommentare RSS Kommentare
Trackback Trackback

SPSS heißt nun PASW

admin | 13. Mai 2009

Ein MaFo-Thema mit Branding-Praxis ;-) SPSS benennt sein Portfolio um und möchte diese künftig unter dem Label PASW (Predictive Analytics Software ) vertreiben.

Was wirklich vielversprechend aussieht ist die Integration von PASW zu entsprechenden Office Produkten. Also Reporting per Knopfdruck!
“Verbesserte Microsoft Office-Integration: Schnellere Erzeugung von sauber formatierten Office-Berichten für eine rechtzeitige Versorgung der Entscheidungsfinder. (PASW Statistics Base)” (Quelle)

Auch eine bessere Grafik wird versprochen! Eventuell echt mal etwas neues ;-)

Hier noch ein ausführlicherer Bericht bei GOLEM.

Kommentare
Keine Kommentare »
Kategorien
Marktforschung
Tags
Charting, Forschung, Marketing: A-Z, marktforschung, PASW, SPSS, statistik, statistiksoftware, Tools
RSS Kommentare RSS Kommentare
Trackback Trackback

Allgemeines

    Impressum
    Über mich
    Marketing Blogs
    NEU!!! CorrComparer 1.0

Tags

automatisch brand Branding brand value CRM Definitionen Definition Social Media Event Excel Handel Handelslexikon Image imagepositionierung Kinder Korrelation Korrelationskoeffizient kostenlos kostenlose Kundenbindung LEH marke marken Markenimage markenpositionierung Marketing: A-Z Marketing: A-Z Marktdaten marktforschung marktstudie Metro parity PASW Ranking Service Social Media SPSS statistik Studie studien subsituierbare TK Tool tracking Trends web 2.0

Archiv

  • März 2010
  • Februar 2010
  • Januar 2010
  • Dezember 2009
  • November 2009
  • Oktober 2009
  • September 2009
  • August 2009
  • Juli 2009
  • Juni 2009
  • Mai 2009
  • April 2009
  • März 2009
  • Februar 2009
  • Januar 2009
rss RSS Kommentare valid xhtml 1.1 design by jide powered by Wordpress get firefox