Video není dostupné.
OmlouvĂĄme se.

Wie interpretiert man lineare Regression in R? 🔎

SdĂ­let
VloĆŸit
  • čas pƙidĂĄn 15. 08. 2024
  • In diesem Video besprechen wir an einem konkreten Beispiel, wie die lineare #Regression in #R interpretiert wird.
    📚 loelschlaeger....
    0:00 Einleitung
    0:06 Datengrundlage
    0:38 Regression in R
    1:13 Der "Call" Abschnitt
    2:07 Der "Residuals" Abschnitt
    3:07 Der "Coefficients" Abschnitt
    7:19 Der letzte Block im Output
    9:48 Dein Selbsttest

Komentáƙe • 21

  • @user-uq4ke3wb2x
    @user-uq4ke3wb2x Pƙed 10 měsĂ­ci +2

    Das beste Video zum Ergebnisausdruck von lm in R. Kurz und bĂŒndig, kein unnötiges Geschwafel. Vielleicht kannst Du auch ein Video zu der I(x...) machen. Das ist fĂŒr mich immer noch ein Geheimnis.

  • @LennArtKanal
    @LennArtKanal Pƙed rokem +1

    Danke fĂŒr das Video, sehr hilfreich! :)

  • @Birgit_HH
    @Birgit_HH Pƙed rokem +1

    Hallo und ganz lieben Dank! Sehr hilfreiches Video 😃
    Eine Frage noch: Kann ich mit Hilfe des t-value sagen, dass ein Effekt grĂ¶ĂŸer/stĂ€rker als der andere ist, weil er weiter von Null entfernt ist?
    Danke schonmal fĂŒr die Antwort đŸŒ·

    • @statistik-mit-lennart
      @statistik-mit-lennart  Pƙed rokem

      Der t-Value macht eine Aussage ĂŒber die Signifikanz des Effekts. Das ist aber etwas anderes als die StĂ€rke des Effekts. Hier wird der Unterschied schön erklĂ€rt: ctreffe.github.io/statspace/effektstaerke.html

    • @Birgit_HH
      @Birgit_HH Pƙed rokem

      Wow... Ganz lieben Dank fĂŒr die schnelle Antwort und den klasse Link đŸ‘â™„ïž

  • @lilli1305
    @lilli1305 Pƙed 6 měsĂ­ci

    Hallo Lennart, danke fĂŒr das Video, ich habe leider nicht ganz verstanden, fĂŒr was das Intercept steht. Also fĂŒr ß0 aber was bedeutet das, was sagt mir der Wert 53840 ĂŒber mein Modell aus? Vielen Dank schonmal

    • @statistik-mit-lennart
      @statistik-mit-lennart  Pƙed 6 měsĂ­ci +1

      Das ist der vorhergesagte Wert, wenn alle erklÀrenden Variablen den Wert 0 haben. Manchmal kann man den Intercept gut interpretieren, manchmal ergibt Interpretation aber keinen Sinn (man kann sich schlecht ein Haus ohne Wohn- und GrundflÀche vorstellen).

  • @IkkaKaa
    @IkkaKaa Pƙed 6 měsĂ­ci

    Sind beide Parameter notwendig, oder kann man đ›Œ oder đ›œ gleich Null
    setzen?

  • @baumchen1228
    @baumchen1228 Pƙed 5 měsĂ­ci

    Hallo! Kann man den p-Wert der F-Statistik in der letzten Zeile als Signifikanz des R2 sehen? Ich habe Artikel gefunden in denen das R2 mit Signifikanzsternchen ausgezeichnet war, aber finde nirgendwo etwas zur Inferenzstatistik vom R2. Kann also dieser Wert damit gemeint sein oder gibt es konkrete Wege das R2 inferenzstatistisch abzusichern? (Beim Inkrement wĂŒrde man das ja ĂŒber die ANOVA geschachtelter Modelle machen) LG

    • @statistik-mit-lennart
      @statistik-mit-lennart  Pƙed 5 měsĂ­ci

      Tut mir leid, davon habe ich noch nichts gehört und kann es mir auch nur schwer vorstellen. Der p-Wert der F-Statistik bezieht sich auf den F-Test so wie im Video erklÀrt, das hat mit dem Anteil erklÀrter Varianz nicht direkt etwas zu tun.

  • @IkkaKaa
    @IkkaKaa Pƙed rokem

    Wie rechnet man mit %.
    Habe Fettanteil (x) und BMI(y). Möchte Aber 40% Fettanteil berechnen.
    Lin. Reg. Output: Y= 13.37394 + 0.32926 * x..
    ----- Y= 13.37394 + 0.32926 * 0.4?

    • @statistik-mit-lennart
      @statistik-mit-lennart  Pƙed rokem

      Das hĂ€ngt davon ab, welche Einheit fĂŒr x bei der SchĂ€tzung verwendet wurde. Wenn x der Fettanteil in Prozent ist, dann muss in die Regressionsgleichung auch x = 40 fĂŒr 40% Fettanteil eingesetzt werden. Wahrscheinlich war das bei dir der Fall, denn ein BMI Wert von 26,5 ist realistischer bei 40% Fettanteil als ein BMI Wert von 13,5.

  • @niklasmuhlbradt2351
    @niklasmuhlbradt2351 Pƙed rokem

    Hallo Lennart,
    vielen Dank fĂŒr das Video. Es war Ă€ußerst hilfreich! Allerdings wollte ich fragen, ob es auch Lösungen fĂŒr den Selbsttest gibt? Ich bin mir unsicher, wie man zu Nr. 4 gelangt, habe jedoch das GefĂŒhl, dass so eine Ă€hnliche Aufgabe auch in der Klausur auftauchen könnte.
    Vielen Dank im Voraus und beste GrĂŒĂŸe!

    • @statistik-mit-lennart
      @statistik-mit-lennart  Pƙed rokem

      Der "Residual standard error" ist 53990 mit 84 Freiheitsgraden, also ist SSR = 53990^2 * 84 = 244853288400. Da R^2 = 1 - SSR / SST ist und wir sowohl R^2 als auch SSR kennen, können wir SST berechnen: SST = 244853288400 / (1 - 0.7333) = 918085070866. Und da SST = SSE + SSR ist, können wir jetzt nach SSE auflösen: SSE = SST - SSR = 918085070866 - 244853288400 = 673231782466.

    • @niklasmuhlbradt2351
      @niklasmuhlbradt2351 Pƙed rokem

      ​@@statistik-mit-lennart Danke fĂŒr den Versuch, es mir zu erklĂ€ren. Ich bin aber leider irgendwie verwirrt. In meiner Formelsammlung stand R^2 = SSR/SST (dort gilt R^2 = 1 - SSE/SST). Mein Ergebnis ergibt allerdings auch keinen Sinn. Es kam 3.3391*10^22 heraus. Aber trotzdem vielen Dank fĂŒr die Antwort! Du gibst dir wirklich viel MĂŒhe, jede Frage zu beantworten!

    • @statistik-mit-lennart
      @statistik-mit-lennart  Pƙed rokem

      Wie sind bei dir SSE und SSR definiert? Es kann sein, dass dein SSR mein SSE und dein SSE mein SSR ist. Vergleiche mal mit meiner Definition bei 8:04. Diese blöde Verwirrung liegt daran, dass die AbkĂŒrzung SSE fĂŒr "Sum of squares explained" (bei mir) oder auch fĂŒr "Sum of squares error" (vielleicht bei dir?) bzw. SSR fĂŒr "Sum of squares residuals" (bei mir) oder fĂŒr "Sum of squares regression" stehen kann. Abgesehen davon sind die hohen Zahlen, die wir berechnet haben, nicht ungewöhnlich: Die Preise, die wir erklĂ€ren, sind sechsstellig. Also können die Residuen durchaus vier- oder fĂŒnfstellig sein. Und quadrieren wir eine fĂŒnfstellige Zahl, erhalten wir eine neun- bis zehnstellige Zahl. Und davon summieren wir mehrere auf.

    • @niklasmuhlbradt2351
      @niklasmuhlbradt2351 Pƙed rokem +1

      @@statistik-mit-lennart Danke fĂŒr den Tipp! Ich habe gerade noch einmal erfolgreich nachgerechnet. Bei mir steht "SSE" fĂŒr "Sum of Squared Errors" und nicht fĂŒr "explained". Also sum(U^2i) in meinem Fall. "SSR" steht fĂŒr "Sum of Squares of the Regression". Vielen Dank fĂŒr die Hilfe!

  • @malte3810
    @malte3810 Pƙed rokem

    Hi,
    kann es sein, dass du bei ca. min 7:50 einen Fehler in der Formel fĂŒr die SSR hast?

    • @statistik-mit-lennart
      @statistik-mit-lennart  Pƙed rokem

      Ups, das Quadrat muss natĂŒrlich außerhalb der Klammer stehen. Danke dir!

  • @benjaminjo5430
    @benjaminjo5430 Pƙed rokem

    Was heißt penalisiert? :D

    • @statistik-mit-lennart
      @statistik-mit-lennart  Pƙed rokem

      Du meinst bei 8:23? Was ich hier sagen wollte: Das normale R^2 steigt mit jedem hinzugenommenem Regressor, es kann also nicht dafĂŒr verwendet werden, die interessanten von den irrelevanten Regressoren zu unterscheiden. Beim adjustierten R^2 hingegen wird quasi durch die Anzahl an Regressoren K dividiert (siehe Formel im Video). Dadurch steigt das adjustierte R^2 nicht bedingungslos mit zusĂ€tzlichen Regressoren, es "bestraft" sozusagen eine grĂ¶ĂŸer werdende Anzahl K. Und mit "penalisieren" wollte ich genau das ausdrĂŒcken. Im Englischen heißt "penalize" nĂ€mlich "bestrafen", aber im Deutschen scheint es das Wort tatsĂ€chlich gar nicht zu geben. 😀