Fehlende Werte ersetzen in SPSS

Sdílet
Vložit
  • čas přidán 7. 09. 2024
  • // Fehlende Werte ersetzen in SPSS //
    Bei systemdefiniert fehlenden Werten sollten, aber müssen nicht zwingend, diese Werte durch benutzerdefiniert fehlende Werte ersetzt werden. Dies ermöglicht eine Identifikation v.a. des Grundes für das Fehlen. Als zweites zeige ich jedoch eine Möglichkeit fehlende Werte mittels sog. Imputation zu ersetzen - die fehlenden Werte werden auf Basis eines Lageparameters ersetzt. In diesem Beispiel zeige ich dies anhand des Mittelwertes.
    Ich weise jedoch ausdrücklich darauf hin, dass das Ersetzen fehlender Werte durch den Mittelwert o.ä wohl begründet sein muss und nicht mit dem Anführen von einer größeren Datenbasis abgetan werden kann. Typischerweise werden Fälle mit fehlenden Werten aus Analysen ausgeschlossen (sog. listenweise Ausschluss).
    Bei Fragen und Anregungen zu m ersetzen von fehlenden Werten in SPSS, nutzt bitte die Kommentarfunktion. Ob ihr das Video hilfreich fandet, entscheidet ihr mit einem Daumen nach oben oder unten. #statistikampc
    Noch mal zum Nachlesen auf meiner Homepage:
    ========================================
    💡 Fehlende Werte in SPSS ersetzen:
    www.bjoernwalt...
    ⭐Kanalmitglied⭐ werden:
    =======================
    / @statistikampc_bjoernw...
    Kanal unterstützen? 🙌🏼
    ===================
    Paypal-Spende: www.paypal.com...
    Amazon Affiliate-Link: amzn.to/2iBFeG9
    Danke für eure Unterstützung! ♥

Komentáře • 14

  • @rinserofwinds
    @rinserofwinds Před 6 lety

    Persönlich bin ich sehr zufrieden mit der systemdefiniert fehlend Funktion von SPSS.
    Mittlerweile ersetze ich sogar im Normalfall benutzerdefiniert fehlende Werte von Datensätzen, die ich zur Bearbeitung bekomme, mit sysmis Werten.
    Also nur, wenn ich dadurch keinen Informationsverlust habe, z.B. den Grund für den fehlenden Wert verliere.
    Das liegt daran, dass benutzerdefiniert fehlende Werte meiner Erfahrung nach schlicht und einfach mehr potentielle Fehlerquellen haben.
    Das mache ich schon alleine deshalb, um einmal alle fehlenden Werte überprüft zu haben und nicht später bei Berechnungen Fehler drin zu haben, weil Missings nicht oder nur teilweise definiert waren.
    Ich hatte gerade noch einen Fall mit einem Datensatz in dem Missings als sysmis, -100, -77- 66 und 0 auftauchten und dann mal wahlweise gar nicht, komplett oder nur teilweise benutzerdefiniert als fehlend angegeben waren...
    Gibt es noch andere Vorteile der benutzerdefinierten Kodierung von Missings, die dir einfallen, außer z.B. sowas wie Information über unterschiedliche Gründe für die fehlenden Werte darin zu kodieren?

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  Před 6 lety +1

      Hallo rinserofwinds, prinzipiell kann man, wie du schon richtig sagst, auch mit SYSMISS ohne Probleme weiterarbeiten. Gerade in Pretests von Fragebögen ist es aber für den Ersteller des Fragebogens von großer Bedeutung zu wissen, warum Werte fehlen: wurde der Fragebogen abgebrochen, eine Option vergessen o.ä.
      Viele Grüße, Björn.

  • @BaluDerBaer933
    @BaluDerBaer933 Před rokem

    Deine Videos helfen mir schon seit Langem! Also vielen Dank! ;)
    Was empfiehlst Du denn bei der Erstellung eines Datensatzes OHNE fehlende Fälle, wo aber die Filter schon so gesetzt sind, dass von mehreren Tausend Befragten von Vornherein nur einige Hundert übrig bleiben? Sollte man da nicht doch Imputieren, dass das nicht noch weniger Fälle werden? Oder doch ausschließen? Es sind jedenfalls ziemlich viele Variablen. Danke!

  • @LauRa-yq4yi
    @LauRa-yq4yi Před 2 lety +1

    Hallo Björn! Lieben Dank für deine Videos, die sind super! Ich habe aktuell ein spezielles Problem, dass ich einfach nicht gelöst bekomme. SPSS erkennt den Punkt als fehlenden Wert teilweise nicht an und ist dann zusätzlich in den Diagrammen zu sehen als wäre es eine Variable. Ich habe schon wirklich gefühlt alles versucht um das zu lösen aber keine Chance bisher. Eventuell weißt du auch auf die Frage eine Antwort, wie ich in SPSS 0% in einem Diagramm als Balken angebe? Ich hoffe Du kannst mir helfen! Herzlichen Dank! :)

  • @user-eg1my9fq5z
    @user-eg1my9fq5z Před rokem

    Hallo, ich habe ein Problem mit der Variable "Alter". Leider habe ich beim Erstellen der Umfrage nicht beachtet, dass man die Eingabe auf eine Zahl beschränken muss. Gewisse Personen haben nun geschrieben z.B. "23", andere "23 Jahre". So kann ich keinen Mittelwert berechnen und die Daten nicht gebrauchen. Wie muss ich da Vorgehen? Ich kann nicht einfach den Durchschnitt des Alters nehmen (wie im Video beschrieben). Es sind ja keine "fehlenden Werte", jedoch muss ich die Werte abhändern und anpassen? Danke für die Hilfe im Voraus.

  • @leonieschmalbach8987
    @leonieschmalbach8987 Před 3 lety

    Hallo Björn, vielen lieben Dank für dein Tutorial, es war mal wieder sehr hilfreich! :)
    Eine Frage hätte ich noch:
    Ich habe einen Fragebogen mit Items des Likert-Typs (5 stufig 1-5) erstellt.
    Wenn ich fehlende Werte mit dem Mittelwert der Zeitreihe ersetzt habe, wird dieser imputierte Wert in den Häufigkeitstabellen und in Diagrammen separat ausgewiesen (bspw. Mittelwert = 2 -> einzeln ausgewiesen in der Häufigkeitstabelle mit der Wertbeschriftung "2" / Eigener Balken im Balkendiagramm mit Beschriftung "2")
    Gibt es eine Möglichkeit, diesen Wert nicht separat sondern mit der eigentlichen 2 zusammenzutun? Oder kann ich diesen zumindest irgendwie als "Imputiert" betiteln?
    Vielen Dank! Lg Leonie

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  Před 3 lety +1

      Hallo Leonie, ich glaube das funktioniert nicht mit dem "zusammenfügen". Ich würde ohnehin sehr davon abraten Imputation zu betreiben - du triffst Verteilungsannahmen, die du nicht begründen kannst. Das ist ganz dünnes Eis und ich kenne wenige Gutachter, die Imputation befürworten. Ich wäre im übrigen auch so einer, aus o.g. Gründen. Daher, fehlende Werte als fehlend lassen und die Fälle listenweise in den Analysen ignorieren.
      Viele Grüße, Björn.

    • @leonieschmalbach8987
      @leonieschmalbach8987 Před 3 lety

      @@StatistikamPC_BjoernWalther Hallo Björn, okay.. Danke dir für die Antwort :)

  • @MrKaplanFilm
    @MrKaplanFilm Před rokem

    Hey Björn. super video. Wie würdest du vorgehen, wenn der zu 'imputierende Wert' binär ist?

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  Před rokem +1

      Hallo und danke für deine Kanalmitgliedschaft!
      Zu deiner Frage: Imputation versucht Annahmen zu treffen, über Sachverhalte wo Werte fehlen. Streng genommen unterstelle ich Werte, ohne zu wissen, was gemessen wurde. Das ist aus meiner Sicht höchst problematisch; egal wie elaboriert die Methode ist. Ich tue mich also sehr schwer damit, Werte anzunehmen, über die ich eigentlich nichts weiß. Mein Rat, und die wohl auch sicherste im Hinblick auf verzerrungsfreie Ergebnisse, wäre daher die NA-Werte zu akzeptieren und listenweise in den jeweiligen Verfahren zu ignorieren.
      Speziell ab S. 10: www.ibm.com/docs/en/SSLVMB_28.0.0/pdf/IBM_SPSS_Missing_Values.pdf
      "The Method tab specifies how missing values will be imputed, including the types of models used. Categorical predictors are indicator (dummy) coded.
      [...]
      The Automatic method scans the data and uses the monotone method if the data show a monotone pattern of missing values; otherwise, fully conditional specification is used. *If you are certain of which method you want to use* , you can specify it as a Custom method."
      Sollten Annahmen getroffen werden, sind diese extrem gut zu begründen, weil schnell Unredlichkeit oder Beliebigkeit vorgeworfen werden kann, wenn nach Gutdünken eine Methode gewählt wird. Wenn man sich nicht sicher ist, sollte man es lieber bleiben lassen. Das ist eine etwas philosophische Diskussion ob oder ob nicht imputiert werden sollte - ähnlich zum Alphaniveau.
      Viele Grüße, Björn.

    • @MrKaplanFilm
      @MrKaplanFilm Před rokem

      @@StatistikamPC_BjoernWalther Danke für deine ausführliche Antwort.

  • @maddasaba
    @maddasaba Před 2 lety

    Also deine Anmerkung zur Ergänzung fehlender Werte ist rein fachlich gesehen falsch. Man sollte fehlende Werte sogar Imputieren um ansonsten entstehende Verzerrungen zu vermeiden. Ein nicht plausibler Wert kann rein statistisch bei Imputation durch beispielsweise eine lineare Regression überhaupt gar nicht entstehen. Mit der von dir gezeigten Methode, mean imputation, drückt man die Streuung jedoch künstlich nach unten. Sie ist deshalb generell nicht zu empfehlen.

  • @aljoscha855
    @aljoscha855 Před 5 lety

    Deine Ausführungen zu multiplen Imputation sind nicht korrekt. Reviewer würden heute ganz im Gegenteil eher sagen, dass man die ganze Stichprobe "Intention-to-treat" verwenden soll.

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  Před 5 lety +4

      Hallo Aljoscha, ich zeige in meinen Videos wie etwas funktioniert. Wenn jemand fehlende Werte ersetzen möchte, kann er das tun - ich zeige nur wie. Was ich persönlich davon halte, sage ich bei kritischen Dingen wie Imputation auch - in diesem Video sogar mehrfach. Was Gutachter davon denken (mögen) ist freilich wieder etwas anderes. Das >was< und v.a. >warum< muss jeder Forscher bzw. die Zielgruppe (Promotions-)Studenten für sich selbst entscheiden - dafür gibt es ja schließlich Platz im Methodenteil. Ich halte von Imputation nichts und kann in Analysen mit listwise deletion leben. Verschiedene Disziplinen haben da verschiedene Auffassungen und das ist auch vollkommen in Ordnung.
      Viele Grüße, Björn.