Markenkunde.de

…Blog rund ums Thema Marketing
  • rss
  • Home
  • Branding
  • eBusiness
  • Fokus: Kunde
  • Marketing: A-Z
  • Marktforschung
  • Studien & Links
  • Tools

Fälle gewichten in SPSS – Grundlagen zum Tool (Teil 1)

admin | 6. August 2009

In den nächsten Tagen werde ich ein kleines Tool online stellen, welches die Gewichtung von Fällen in SPSS (PASW) bequem für einen durchführt. Somit sind nur noch ein paar Eingaben in eine Excelmaske nötig, und man bekommt einen fertigen Syntax, der die SPSS-Daten gewichtet.
Bevor ich das Tool online stelle, erstmal ein paar Grundlagen, insbesondere:

  • Wie können nicht-repräsentative Daten repräsentativ gemacht werden?
  • Wie werden Gewichte berechnet?
  • Wie können Gewichtungsvariablen in SPSS eingefügt werden?
  • Wie kommt man an Daten, die die relevante Grundgesamtheit repräsentieren?

Besonders bei semiprofessionellen Onlinebefragungen oder empirischen Studienarbeiten hat man oft nicht die Möglichkeit oder die Zeit, seine Daten mittels eines Quotenverfahrens repräsentativ zu gestalten. Dazu kommt, dass man im Vornherein auch nur schlecht beurteilen kann, welche Datensätze bei der Datenbereinigung aus der Datenanalyse wieder ausgeschlossen werden. Summa Summarum – oft entsprechen die Daten nicht der relevanten Grundgesamtheit. Was also bietet sich an, um „nicht-repräsentative Daten“ zumindest annähernd zu repräsentativieren? Das Zauberwort heißt „Gewichtung“ und geht mit SPSS recht einfach. Der Grundgedanke der Gewichtung ist, dass unterrepräsentierte Fälle (also Antworten von Personen, die nach ihren betrachteten Merkmalen „zu wenig“ in der Stichprobe vorhanden sind) stärker in die Ergebnisse mit Einfließen, als überrepräsentierte Fälle.

Beträgt das Verhältnis von Männern zu Frauen in der Grundgesamtheit 1:1 (d.h. 50 Prozent Männer und 50 Prozent Frauen), in der Stichprobe wäre die aber anders (z.B. 25% Männer und 75% Frauen), so müssten die Antworten der Männer für die folgenden Analysen stärker gewichtet werden, als die der Frauen.
Die Gewichte berechnen sich, indem man den Sollwert (hier: 50%) durch den Istwert dividiert, d.h.

Wm = 0,50 / 0,25 = 2,000
Wf = 0,5 / 0,75 = 0,667

Nun müsste man also im Datensatz eine neue Variable (hier: „weight_1“) einfügen, nach welcher die Fälle gewichtet werden. Bei den Männern würde also überall der Wert 2,000 drinstehen, bei den Frauen 0,667. Manuell ist die Eingabe dazu wohl etwas schwierig, also bietet sich hierzu en Syntax an. Für die Geschlechtvariable „V_geschl“ (hier: männlich = 0, weiblich = 1) würde der Syntax lautet:

If (V_geschl = 0) weight_1 = 2 .
If (V_geschl = 1) weight_1 = 0,667 .

Achtung, je nach SPSS-Version & Einstellung kann sein, dass Dezimalstellen durch Punkte ersetzt werden müssen!

Nun wurde die neue Variable ausgefüllt (Auf Sonderfälle mit Missings, etc gehe ich diesmal noch nicht ein). Damit die Fälle nun auch gewichtet werden, kann man entweder über das Menü, oder aber wieder bequem über den Syntax die Fälle gewichten:

Weight by weight_1 .

Et VoilÃÊ, nun ist der Datensatz nach dem Geschlecht gewichtet! Das alleine reicht aber noch nicht aus, schließlich könnte es ja sein, dass bei den 75 Frauen die Hälfte unter 20 Jahren alt ist, diese in der Grundgesamtheit aber gleichverteilt sind. Auf die Gewichtung mit mehreren Kriterien gehe ich im nächsten Beitrag ein. Genauso ist die Problematik, dass man oft bei „persönlichen“ Daten wie Alter, Einkommen und Beruf viele fehlende Werte bekommt (sog. Missing Values), welche bei der Gewichtung auch nochmals separat berücksichtigt werden müssen.

Natürlich sollte man sich im Vornherein überlegen, ob die Gewichtung überhaupt Sinn macht. Spontan fallen mir 2 Kriterien ein, nach denen man das entscheiden könnte:
a) Macht die Gewichtung inhaltlich Sinn?
Ist das Ziel einer Erhebung, Zusammenhänge zu ermitteln (bspw. Korrelationskoeffizienten), so ist es fraglich, ob man wirklich eine Gewichtung benötigt. Geht es aber darum, eine „allgemeine Meinung“ zu bekommen, sieht das ganze natürlich schon wieder anders aus.
b) Ist die Gewichtung pragmatisch?
In diesem Fall macht es Sinn, erstmal „spaßeshalber“ eine Gewichtung durchzuführen und zu analysieren, in wiefern sich die gewichteten Ergebnisse von den ungewichteten unterscheiden. Ist das nur marginal, ist natürlich fraglich, ob der zusätzliche Erklärungsbedarf (nach welchen Kriterien wurde warum und mit welchen Daten wie gewichtet?) den zusätzlichen Nutzen gerechtfertigt. Aber genauso sollte man sich auch die Werte der Gewichte anschauen: Es gibt eine Faustregel, dass die Gewichte möglichst nicht kleiner als 0,3, und möglichst nicht größer als 3,0 sein sollten.

Und woher bekommt man Daten über die Grundgesamtheit? Nunja, das hängt immer stark vom jeweiligen Analysegegenstand ab. Bevölkerungsrepräsentative Daten bzgl. der Randverteilung erhält man bspw. aus dem Mikrozensus. Das ist eine regelmäßig vom Statistischen Bundesamt durchgeführte „Pflichtbefragung“ (die zufällig ausgewählten Personen sind verpflichtet, an der Befragung teilzunehmen). Aber auch andere „große“ Befragungen können Hinweise geben, z.B. das Stern Marken Profile, TDW, etc…

Entspricht die relevante Grundgesamtheit nicht der deutschen Bevölkerung, sondern einer anderen Zielgruppe, so müssen andere Basisdaten herangezogen werden, zum Beispiel:
Grundgesamtheit der Internetnutzer: (N)onliner-Atlas, AGOF Internet Facts

    Grundgesamtheit einer Universität: Hochschulinterne Statistiken
    Grundgesamtheit der Kunden bei einer Kundenbefragung bei registrierten Kunden: Kundendatenbank
    Grundgesamtheit der Kunden bei einer Kundenbefragung bei nicht registrierten Kunden, z.B. in einem Geschäft: Beobachtung der Kundenströme, z.B. Geschlecht, grobe Altersschätzung, KFZ-Ortskennzeichen, etc
Kommentare
Keine Kommentare »
Kategorien
Tools
Tags
Excel, Gewichtung, marktforschung, SPSS, statistik, Tool
RSS Kommentare RSS Kommentare
Trackback Trackback

Allgemeines

    Impressum
    Über mich
    Marketing Blogs
    NEU!!! CorrComparer 1.0

Tags

automatisch brand Branding brand value CRM Definitionen Definition Social Media Event Excel Handel Handelslexikon Image imagepositionierung Kinder Korrelation Korrelationskoeffizient kostenlos kostenlose Kundenbindung LEH marke marken Markenimage markenpositionierung Marketing: A-Z Marketing: A-Z Marktdaten marktforschung marktstudie Metro parity PASW Ranking Service Social Media SPSS statistik Studie studien subsituierbare TK Tool tracking Trends web 2.0

Archiv

  • Mai 2011
  • März 2010
  • Februar 2010
  • Januar 2010
  • Dezember 2009
  • November 2009
  • Oktober 2009
  • September 2009
  • August 2009
  • Juli 2009
  • Juni 2009
  • Mai 2009
  • April 2009
  • März 2009
  • Februar 2009
  • Januar 2009
rss RSS Kommentare valid xhtml 1.1 design by jide powered by Wordpress get firefox