Klára Soltész-Várhelyi
Klára Soltész-Várhelyi
  • 450
  • 808 583

Video

ANOVA elmélete 08 - F-érték (illetve Mean squares of Model és Residuals) számítása
zhlédnutí 1,3KPřed 3 lety
ANOVA elmélete 08 - F-érték (illetve Mean squares of Model és Residuals) számítása
ANOVA elmélete 07 - Sum of Squared Residuals számítása
zhlédnutí 1,1KPřed 3 lety
ANOVA elmélete 07 - Sum of Squared Residuals számítása
ANOVA elmélete 06 - R-négyzet, eta-négyzet, omega-négyzet
zhlédnutí 1,6KPřed 3 lety
ANOVA elmélete 06 - R-négyzet, eta-négyzet, omega-négyzet
ANOVA elmélete 05 - Predikált érték és Sum of Squares of Model számítása
zhlédnutí 1,4KPřed 3 lety
ANOVA elmélete 05 - Predikált érték és Sum of Squares of Model számítása
ANOVA elmélete 04 - Referencia modell és Sum of Squares of Total számítása
zhlédnutí 1,9KPřed 3 lety
ANOVA elmélete 04 - Referencia modell és Sum of Squares of Total számítása
ANOVA elmélete 03 - Függő és független változó
zhlédnutí 2,2KPřed 3 lety
ANOVA elmélete 03 - Függő és független változó
ANOVA elmélete 02 - Familywise error, azaz többszörös tesztelés ára
zhlédnutí 2,1KPřed 3 lety
ANOVA elmélete 02 - Familywise error, azaz többszörös tesztelés ára
ANOVA elmélete 01 - Független és összefüggő mintás, egy- és többszempontos ANOVA
zhlédnutí 6KPřed 3 lety
ANOVA elmélete 01 - Független és összefüggő mintás, egy- és többszempontos ANOVA
Mediációs elemzések 11 - Mediáció JASP-ben 2/2
zhlédnutí 987Před 3 lety
Mediációs elemzések 11 - Mediáció JASP-ben 2/2
Mediációs elemzések 10 - Mediáció JASP-ben 1/2
zhlédnutí 1,3KPřed 3 lety
Mediációs elemzések 10 - Mediáció JASP-ben 1/2
Mediációs elemzések 09 - Ábra és táblázat mediáció publikálásához
zhlédnutí 850Před 3 lety
Mediációs elemzések 09 - Ábra és táblázat mediáció publikálásához
Mediációs elemzések 08 - Változók típusa mediációban
zhlédnutí 451Před 3 lety
Mediációs elemzések 08 - Változók típusa mediációban
Mediációs elemzések 07 - Mediáció útvonalainak értelmezése
zhlédnutí 719Před 3 lety
Mediációs elemzések 07 - Mediáció útvonalainak értelmezése
Mediációs elemzések 06 - Mediáció beállításainak kérdései - kell-e standardizálni?
zhlédnutí 658Před 3 lety
Mediációs elemzések 06 - Mediáció beállításainak kérdései - kell-e standardizálni?
Mediációs elemzések 05 - Mediáció-számítás módszerei (OLS regression és SEM)
zhlédnutí 833Před 3 lety
Mediációs elemzések 05 - Mediáció-számítás módszerei (OLS regression és SEM)
Mediációs elemzések 04 - Konfidencia intervallum & szignifikanciaérték mediációban 1/2
zhlédnutí 748Před 3 lety
Mediációs elemzések 04 - Konfidencia intervallum & szignifikanciaérték mediációban 1/2
Mediációs elemzések 03 - Konfidencia intervallum & szignifikanciaérték mediációban 1/2
zhlédnutí 841Před 3 lety
Mediációs elemzések 03 - Konfidencia intervallum & szignifikanciaérték mediációban 1/2
Mediációs elemzések 02 - Direkt és indirekt hatás
zhlédnutí 1,2KPřed 3 lety
Mediációs elemzések 02 - Direkt és indirekt hatás
Mediációs elemzések 01 - A mediáció koncepciója
zhlédnutí 1,5KPřed 3 lety
Mediációs elemzések 01 - A mediáció koncepciója
Moderációs elemzések 07 - Adatok előkészítése moderációhoz JASP-ben
zhlédnutí 665Před 3 lety
Moderációs elemzések 07 - Adatok előkészítése moderációhoz JASP-ben
Moderációs elemzések 06 - Moderációs elemzés és grafikus megjelenítése JASP-ben
zhlédnutí 1,1KPřed 3 lety
Moderációs elemzések 06 - Moderációs elemzés és grafikus megjelenítése JASP-ben
Moderációs elemzések 05 - Adatok előkészítése moderációhoz Excelben
zhlédnutí 920Před 3 lety
Moderációs elemzések 05 - Adatok előkészítése moderációhoz Excelben
Moderációs elemzések 04 - Interakciós tag a regressziós egyenletben
zhlédnutí 882Před 3 lety
Moderációs elemzések 04 - Interakciós tag a regressziós egyenletben
Moderációs elemzések 03 - Moderáció elemzés grafikus ábrázolása
zhlédnutí 806Před 3 lety
Moderációs elemzések 03 - Moderáció elemzés grafikus ábrázolása
Moderációs elemzések 02 - Moderáció (interakció) koncepciója
zhlédnutí 973Před 3 lety
Moderációs elemzések 02 - Moderáció (interakció) koncepciója
Moderációs elemzések 01 - Bevezetés
zhlédnutí 1,7KPřed 3 lety
Moderációs elemzések 01 - Bevezetés
Többszörös lineáris regresszió 31 - Publikálás
zhlédnutí 2,2KPřed 3 lety
Többszörös lineáris regresszió 31 - Publikálás
Többszörös lineáris regresszió 30 - Egy teljes elemzés JASP-ben 2/2
zhlédnutí 1,9KPřed 3 lety
Többszörös lineáris regresszió 30 - Egy teljes elemzés JASP-ben 2/2
Többszörös lineáris regresszió 29 - Egy teljes elemzés JASP-ben 1/2
zhlédnutí 3,2KPřed 3 lety
Többszörös lineáris regresszió 29 - Egy teljes elemzés JASP-ben 1/2

Komentáře

  • @RonaiHenrik
    @RonaiHenrik Před 27 dny

    Kedves Klára! Ex-pázmányos diákként ismét úgy adódott, hogy ezeket a videókat nézem és egy műhelymunkát írok :) Egyrészt nagyon köszi ezeket a videókat! Másrészt 14:10 környékén azon tanakodom, hogy a df miért egyezik meg az elemszámmal? Nem N-1 a képlet? Nem értem, hogy a 19 elemszámú adatbázisban miért 19 a df. És amúgy az én adatbázisomban is ugyanez a problémám, amikor lehúzom a normalitás teszteket. Nem értem az okát.

    • @stathelp
      @stathelp Před 26 dny

      Azt a szórásnál tanultuk, de nem mindig N-1 az érték, hanem N mínusz a felhasznált összefüggések száma (a szabad választások számát a felhasznált összefüggések korlátozzák). A szórás számításánál az átlagot használjuk fel összefüggésként, ezért N-1. De ha emlékszel a független mintás t-próbára, ott N-2 volt (a két mintaátlag miatt). A normalitásteszt nem használ fel összefüggést (pl mintaátlagot), csak a minta értékeit, így ott N-0, azaz N a szabadságfok. Remélem segített, és sok sikert a tanulmányaidhoz!

    • @RonaiHenrik
      @RonaiHenrik Před 26 dny

      @@stathelp Igen, így már emlékszem és világos, köszönöm!. Valóban, a független mintás t-próbánál stimmel a df=39 (N = 41). Illetve még egy olyan gyors kérdésem van, hogy már lemondtam a független mintás t-próbáról, mert nem jött ki a K-S és S-W teszteken a normalitás az összes csoportomon. Viszont most e videó alapján megtaláltam ezt a cikket: Orcan, F. (2020). Parametric or non-parametric: Skewness to test normality for mean comparison. International Journal of Assessment Tools in Education, 7(2), 255-265. Itt a 2. oldal felétől az van, amit te is mondasz tk., hogyha csak enyhén csúcsos és enyhén ferde, mégis feltételezhető a normális eloszlás és mégis használható a független mintás t-próba a Mann-Whitney helyett. A mintám csoportjain kiszámoltam és az összesnél .001 < Z < 1.1, tehát 1.96 alatti, azaz ha jól értem, mégis használhatom a függ. mintás t-próbát. Ezt jól értelmezem?

  • @mettzb16f10
    @mettzb16f10 Před 2 měsíci

    Azon gondolkoztam, hogy mit lehet akkor tenni, ha például three-way ANOVA-t szeretnénk elvégezni, de a faktorkombinációk néhány szintjén nem teljesül a normalitás? Sajnos a nem parameteres verziók az általam ismert szoftverekben nem képesek háromutas dolgokra, az interakciókról nem is beszélve. Vagy csupán a reziduálisokkal érdemes ilyenkor torődni, nen a "nyers adatokkal"? Persze a kérdés még akkor is érvényes: mit lehet vajon alkalmazni two vagy three way anova helyett, ha semmilyen módszerrel semmi sem normális eloszlású?

  • @bencerosta3941
    @bencerosta3941 Před 3 měsíci

    Jesszusom ez a videó sorozat most megment, Statistics 2-t hallgatok jelenleg angolul de az anyagot keszekuszán adták le nem úgy mint itt tömören mégis részletesen és érthetően KÖSZÖNÖM!!

  • @mettzb16f10
    @mettzb16f10 Před 3 měsíci

    Az alábbi jelenséggel találkoztam ma, ami az outlierek detektálását illeti: 1. 5 prediktort emelek a modellbe 2. Azonosítottam a többdimenziós kiugró értékeket Cook's distance alapján. Töröltem őket. 3. Az 5 prediktorból egyet kiveszek, mert nem felel meg a feltételeknek. Maradt 4 prediktor. 4. Kíváncsiságból megnéztem, hogy az előbb kitörölt outlier Cook értéke milyen akkor, ha rögtön az előbb említett 4 prediktort emelem a modellbe. Ebben az az esetben már éppen nem outlier, de más megfigyelések outlierré váltak. Ismét szedjem őket ki? Hol van ennek a lépésnek, az outlier detectionnek a helye a flowban? Minden prediktor bevonásánál/eltávolításánál végezzem el? De akkor hol van ennek a vége? Nem lenne érdemes a "körkörös analízis" hibájába esnem. Nem szeretnék egy túlillesztett modellt kapni, és nincs nincs elég elemszám egy teszthalmazhoz. :(

    • @stathelp
      @stathelp Před 3 měsíci

      Leginkább azt tudom tanácsolni, hogy ne mechanikusan csináld a dolgot, hanem elméleti szepontból is mérlegelve, mennyi embert veszel ki. A másik, hogy valószínűleg gyenge lehet a modell (túl kicsi elemszám és/vagy túl nagy kollinearitás és/vagy túl gyenge hatások). Ha ennyire kis változtatásokkal ekkora változás történik az értékekben (pl. a Cook-értéket nem könnyű átlökni a problémás oldalra), akkor az általában gyenge modellre utal. A problémás aspektust próbált javítani (nyilván elemszámot nem lehet, de a változók kiválasztását igen)!

  • @andimate8132
    @andimate8132 Před 4 měsíci

    Köszönjük!

  • @khtfgfc
    @khtfgfc Před 4 měsíci

    minden girbe-gurba eloszlás nevében köszönöm ezt a videót!

  • @andimate8132
    @andimate8132 Před 4 měsíci

    Köszönjük!

    • @stathelp
      @stathelp Před 4 měsíci

      Köszönöm szépen!

  • @mettzb16f10
    @mettzb16f10 Před 5 měsíci

    Tegyük fel, hogy meg szeretném tudni, hogy egy folytonos változó átlaga szignifikáns különbséget mutat-e két csoport között. Azt már tudom, hogy a két csoport szórása szignifikánsan különbözik. És itt jön az, amit nem értek. Ha van két mintám, aminek a szórásai szignifikánsan különböznek, az nem jelenti, hogy a két mintám két eltérő eloszlású populációból származik? Ezek után, ha az átlagok különbsége nem is lesz szignifikáns, a két minta akkor sem ugyanabból a sokaságból jön, nem?

    • @stathelp
      @stathelp Před 5 měsíci

      Nagyon jó meglátás! Azonban: 1) itt a paraméteres próbák feltételeinek ellenőrzését tanuljuk, a sorozat elején elhangzik, hogy a két orvosi lovunk a Pearson korreláció és a klasszikus független mintás t-próba. Ez utóbbi esetén a minták eltérése a középértékek közötti eltérésre (azaz shift-re) vonatkozik. 2) majd akkor, amikor a minták eltérését tanuljuk, meg fogjuk tanulni, hogy két minta nem csak a középértékében térhet el (ezen belül is, nem csak átlagában, hanem mediánjában is, mely megint egy másik próba), hanem eltérhet szórásában (ennek egyik lehetséges tesztelése a Levene teszt), vagy például az eloszlás alakjában is (erre jó a két-mintás Kolmogorov-Smirnov). 3) A legtöbb kutató amikor eltérésről beszél, csupán a középértékek közötti eltérésre gondol, csak azt vizsgálja. Ennek ellenére rendkívül érdekes lehet az is, ha a szórások térnek el - hiszen az azt jelenti, hogy az egyik minta valamiért heterogénebb. Hogy mondjak egy valós példát erre: az IQ nemi különbségei. Jelenleg azt gondoljuk, hogy az átlag (vagy medián) IQ nem tér el férfiak és nők között, de a férfaiknál sokkal nagyobb az IQ szórása, azaz belőlük inkább kerülnek ki zsenik (nem véletlen, hogy a legnagyobb tudósaink, iróink, stb. inkább férfiak) de az idióták is (erre is lehet példát találni bőven). Mindennek izgalmas evolúciós, illetve idegrendszeri magyarázata is van.

  • @kelecsenyizoltan274
    @kelecsenyizoltan274 Před 7 měsíci

    Nagyon köszönöm! Érthető.

  • @tarhonyas_terciusz
    @tarhonyas_terciusz Před 7 měsíci

    1:32 😂🤣

  • @dzsini2
    @dzsini2 Před 8 měsíci

    A koefficiens nem csak a b1? Így nem két koefficiens, hanem csak egy koefficiens és egy konstans van? Az ábrán az szerepel, hogy "ezeket nevezzük a két regressziós együtthatónak". Mellesleg ezer köszönet a videókért, tökéletesen, érthetően elmagyaráznak mindent, rengeteget tanulok belőlük! Életmentők!

    • @stathelp
      @stathelp Před 8 měsíci

      A b0-t is gyakran koefficiensnek nevezzük, ez az intercept vagy konstans. A b1 is koefficiens, ez a meredekség (slope). Örülök, ha segítettek. Sok sikert a tanulmányaidhoz!

  • @wiccagirl2853
    @wiccagirl2853 Před 9 měsíci

    Kedves Klára! Szuperek a videók. Még nem néztem mind végig, de az lenne a kérdésem, hogy a Jasp tud olyan változókat kezelni, amelyek tartományokat tartalnaznak? Pl osztályzatnál, hogy 0-10 pont = 1-es. Ha igen, akkor hol és hogyan jelenik itt meg? Hogyan lehet be/átállítani? Köszönöm!

  • @npeti95
    @npeti95 Před 10 měsíci

    Orulok neki, hogy magyarul is van fent oktato tartalom statisztikabol. Koszi, hogy ennyi energiat fektettel bele.

  • @melani1102
    @melani1102 Před 11 měsíci

    Kedves Klára! Milyen próbát alkalmazzunk ha sem a szóráshomogenitás, sem a normalitás nem teljesül a mintákon? Válaszát előre is köszönöm!

    • @stathelp
      @stathelp Před 11 měsíci

      Ez leginkább a konkrét adatok eloszlásától függ, de általánosságban elmondható, hogy skála mérési szint mellett a normalitás sérülésekor legtöbbször valamilyen rangsorolásos eljárást választunk (pl. Spearman, Mann-Whitney, Wilcoxon), és a rangsorolás a szóráshomogenitás sérülését is viszonylag jól kezeli. Fordítva ez nem igaz - a szóráshomogenitás sérülésének kezelésére kitalált korrekciók (pl. Welch-teszt) nem alkalmasak a normalitás sérülésének kezelésére.

  • @NancyMalligen
    @NancyMalligen Před rokem

    Ezt le kell írnom valahová. "A Khi2 definíciója gyakorlatilag: normál eloszlást követő változók négyzetre emelt értékének összegzésének eloszlásának leírására alkalmas eloszlás." 🐱 Imádom <3

  • @369chilli
    @369chilli Před rokem

    Örülök hogy rátaláltam csatornádra. Lényegretörő, érthető videók. Nagyon hasznos, köszönöm!

  • @dorottyagulyas3804
    @dorottyagulyas3804 Před rokem

    Köszönöm szépen az érthető és nagyon részletes segítséget! Rengeteget segít a szakdolgozatom statisztikai részének megírásában!!:)

  • @magyarml
    @magyarml Před rokem

    Kedves Klára! Egy olyan kérdésem lenne, hogy milyen vizsgálatoknál lehet, és milyen vizsgálatoknál nem lehet a Likert skálát Skála mérési szintűnek tekinteni? Illetve, ha annak tekintjük, akkor az eredményezhet-e hibákat, és milyeneket? Válaszát előre is köszönöm!

    • @stathelp
      @stathelp Před rokem

      A legtöbb kérdőív likert-skálát használ az itemekhez - ezeken minden meghökkenés nélkül el szoktuk végezni a reliabilitás vizsgálatot, mely korrelációkon alapul, illetve össze szoktuk adni / átlagolni utána az itempontszámokat - pedig, ha belegondolsz, ordinális változókat szigorú értelemben véve nem lehet összeadni. Ezzel szemben, egy nem vennék be Likert-skála változót parametrikus teszt (pl.t-próba, ANOVA Pearson-korreláció vagy regresszió) függőváltozójaként - egyszerűen azért sem, mert nem kellően folytonos (nem vehet fel kellően sokfajta értéket) ahhoz, hogy a normáleloszlás kialakulhasson. Egy tízfokú Likert-skálán már viszont -ha nagyon muszáj - el lehet gondolkodni parametrikus teszteknél is

    • @magyarml
      @magyarml Před rokem

      @@stathelp köszönöm a választ. Azért kérdezem, mert találtam olyan cikkeket is, amik szerint használhatók a paraméteres tesztek is Likert skálák esetén, mivel ezek a tesztek eléggé robosztusak, illetve sok évtizedes gyakorlat van mögötte. Erről mit gondol? Illetve láttam olyan gyakorlatot, is, ahol a likert skálák értékeinek összegzésével képeztek új változót. Ez jó módszer lehet? Illetve alkalmas lehet összefüggés-vizsgálatra?

  • @lxathu
    @lxathu Před rokem

    Ez egy méltatlanul alábecsült csatorna, pedig a magyarázat mennyisége és minősége kiemelkedik nemcsak a magyar, de az angol nyelvű anyagok közül is.

  • @lxathu
    @lxathu Před rokem

    Köszi! 30 évvel ezelőtt, amikor kérdezhettem volna, nem tudtam jól megfogalmazni, hogy miért zavar a négyzetre emelés, miközben a közönséges abszolút érték ugyanúgy elnyomná az ellenkező előjelek egymást közömbömbösítő hatását, és sosem volt rá érdemi magyarázat - a nagy eltérések még nagyobbra torzításán kívül, amit kicsit művinek éreztem -, amikor valstatba botlottam. A deriválhatóságra nem gondoltam. Tényleg köszönöm, öregkoromban nyugodtabban fogok aludni végre.

  • @justace7738
    @justace7738 Před rokem

    Köszönöm, hogy készítesz ilyen videokat! Megtalált hiba: 0,09% esély 100darabos mintavételezésnél. (egy tizedes elcsúszott)

  • @messikis9828
    @messikis9828 Před rokem

    Köszi, megment ez melóban holnap

  • @rolandguraly6876
    @rolandguraly6876 Před rokem

    Nagyon hasznos videók, köszönjük!

  • @banaiviktor6634
    @banaiviktor6634 Před rokem

    Szuper az összes videó, nagy nagy köszönet érte!

  • @akosrozsadombi7911
    @akosrozsadombi7911 Před rokem

    Kiit ért kontroll személyek alatt?

  • @barktwain
    @barktwain Před rokem

    nagyon jól érthető. pont egy hobbi projektemhez van szükségem erre és eddig totál black magic volt ez az egész. ezekkel a videókkal már egyre jobban értem. hiánypótló! :)

  • @barktwain
    @barktwain Před rokem

    tök jól érthető. köszönöm! :)

  • @gabormerhelik614
    @gabormerhelik614 Před rokem

    Nagyon jól érthetően elmagyarazza a videóban. Nekem sokat segített

  • @oszintenszolva3592
    @oszintenszolva3592 Před rokem

    Nagyon hálás vagyok ezekért a videókért! Egy Istennő vagy!!!!!!!!!!!!!!!

  • @petersebestyenbalog2760

    Köszönöm a segítséget :)

  • @norbist2
    @norbist2 Před 2 lety

    Nálam mindkét oszlopot ugyanarra a tengelyre teszi. A másikat meg beszámozza: 1,2,3 ... Az enyémet valami down-kórosok írták.

  • @csengetoth2437
    @csengetoth2437 Před 2 lety

    Nagyon sokat segítenek a videóid, átlátható minden. Köszönöm!

  • @midnightsunprincess
    @midnightsunprincess Před 2 lety

    Kedves Klára! Tudnál kérlek abban segíteni, hogy az elméletileg lehetséges minimum és maximum az mennyiben más mint a sima minimum és maximum? Nagyon szépen köszönöm!!

  • @Kriszti-fj9fe
    @Kriszti-fj9fe Před 2 lety

    Sokat tanultam Öntől, köszönöm.

  • @dante4569dante
    @dante4569dante Před 2 lety

    Remek, hogy létrehozta a csatornát! Az életemet menti meg az egyetemen! Volt értelme vele dolgozni és nagyon szép munka :D

  • @mettzb16f10
    @mettzb16f10 Před 2 lety

    Én nagyon várom a folytatást. Ez a csatorna sokkal többet segített, mint az összes statisztika kurzusom összesen.

  • @groffelfoldi
    @groffelfoldi Před 2 lety

    A szabadságfokkal osztott varianciánál az eredmény 0,2777, de 0,777-et mondasz. :)

  • @mihalyj3385
    @mihalyj3385 Před 2 lety

    Köszönöm a videókat nagyon hasznos!!

  • @belapallagi
    @belapallagi Před 2 lety

    Tiszta, érthető és érdekes előadás. Nagyon okos előadó! Köszönöm.

    • @stathelp
      @stathelp Před 2 lety

      Köszönöm a visszajelzést!

  • @mihalyrampay6169
    @mihalyrampay6169 Před 2 lety

    Kedves Klára! Nagyon szépen köszönöm a videót, hihetetlenül hasznos. Lehet, hogy én nem figyeltem megfelelően, de mintha végül nem tértél volna ki a H0 sorok jelentőségére és értelmezésére. Bár azt látom, hogy a publikálásnál már törlöd őket. Erről tudsz pár szót ejteni? Nagyon köszönöm!!

    • @stathelp
      @stathelp Před 2 lety

      Kedves Mihály! Örülök, ha hasznosnak érezted! A H0 sorok majd a hierarchikus regressziónál lesznek fontosak. Néhány (jópár) videóval arrébb lesz róla szó (nem is kevés).

    • @mihalyrampay6169
      @mihalyrampay6169 Před 2 lety

      @@stathelp Kedves Klára! Nagyon szépen köszönöm!

  •  Před 2 lety

    Egészen hasznos is lenne a dolog, de legalább a címet írjük már le helyesen! *Többszörös*

  • @PittMex
    @PittMex Před 2 lety

    Már nincs tobb video.. :(

    • @stathelp
      @stathelp Před 2 lety

      Le a kalappal előtted, ha mind a 400-500-at végignézted. Tavasszal várhatóan folytatom majd az ANOVA sorozatot. Illetve ha lesz rá kapacitásom, lesz egy főkomponens sorozat is :)

    • @PittMex
      @PittMex Před 2 lety

      Kuldtem emailt..

  • @lyk111
    @lyk111 Před 2 lety

    Köszönjük szépen, alapos munka!

  • @Hakkai05
    @Hakkai05 Před 2 lety

    Hát erre a sorozatra és csatornára most akadtam rá..Hiánypótló és életmentő!

  • @fforfanny5822
    @fforfanny5822 Před 2 lety

    az életem mentik meg ezek a videók, köszönöm! üdv, egy eltés gólya

    • @stathelp
      @stathelp Před 2 lety

      Sok sikert a tanulmányaidhoz!

  • @PittMex
    @PittMex Před 2 lety

    Én azt nem értem hogy ha teljesul a CLT, akkor ez azt is jelenti hogy innentol kezdve normal eloszlasnak tekinhetem a populáciot s ez felhatalmaz hogy t-probakat is vegezhetek , még akkor is ha a populáciorol pl eros a gyanum hogy nem normegyenletes eloszlast kovet? Mennyire helyes ez a megkozelites

    • @stathelp
      @stathelp Před 2 lety

      Ez egy nagyon jó kérdés, és a téma heves internetes viták alapja. Először is a központi határeloszlás tételnek nagyon sok mindenben van szerepe (gyakorlatilag ezért működik a statisztika): 1) részben felelős azért, hogy sok tulajdonság a populációban normál eloszláshoz közelítsen, mert a tulajdonságokat sokminden befolyásolja. Ettől még nem biztos, hogy a tulajdonságot az általam vett mérőeszközön keresztül is normáleloszlásúnak fogom látni (itt most nem a mintavételezés bizonytalanságáról beszélek, hanem kifejezetetten arról, ahogy a tulajdonságot mérem), mert sok mérőeszközünk van, mely nem egyforma felbontásban mér a tulajdonság teljes tartományán (pl. perfekcionizmus skála, mely a magasan perfekcionisták részén jól mér, a kb. normál tartományban viszont padlóhatás miatt egy csomó embert összemos). 2) a predikciónk hibájának normáleloszlását hozza létre (regressziós videóban részletesebben: ha a modelltől független a sok egyéb tényező, mely a hibát, zajt létrehozza, akkor a zaj normál eloszlást fog követni). 3) sok próba valóban robusztusabbá válik nagyobb elemszámon a normalitás sérülésére. Itt az a nehéz, ez a robusztusság különböző sérülésfajtáknál eltérő elemszámnál válik kellően erőssé. Pl. t-próbánál mindkét minta ugyanabba az irányba ferde - viszonylag kis elemszámnál is már robusztus a t-próba. A két minta eltérő irányba ferde: akár több ezer főnél sem az. Szóval óvatosan azzal, amikor a normalitás sérülése ellenére t-próbát használsz a CLT-re hivatkozva. Sokszor teljesen rendben van, néha meg nagyon nem. Inkább azt szoktam tanácsolni, hogy vizsgáld meg, hogyan sérül a normalitás (hisztogram, Q-Q plot, ferdeség, csúcsosság segítségével), és a robusztussági szakirodalmat figyelembe véve dönts arről, használhatsz-e t-próbát ennek ellenére. (itt továbbra is a központi határeloszlásnak köszönheted, ha a robusztusság kialakult, de nem vakon arra hagyatkozva döntesz)

  • @PittMex
    @PittMex Před 2 lety

    Olvastam hogy a Khi2 teszt alkalmas lehet egyenletes eloszlás tesztelésére. Viszont ez eléggé érzékeny mivel nagy elemszámnál gyakran elveti a H0 hipotézist, kis elemszámnál pedig elfogadja hogy a minta egyenletes eloszlást kovet holott grafikusan kétségbe vonható :D

    • @stathelp
      @stathelp Před 2 lety

      Igen, többek között arra is jó, a videóban csak néhány példát hozok, ennél sokkal több helyen használjuk! Sok goodness-of-fit elemzésben megjelenik a Khi2 eloszlás, ahol egy mért és valamilyen modell által implikált eloszlás hasonlóságát teszteljük, az uniform eloszláshoz való hasonlóság vizsgálata is ilyen. És valóban a legnagyobb probléma az szokott lenni, hogy nagy elemszámokon túlérzékeny, kis elemszámokon pedig a komplexitás növekedésével gyorsan veszít érzékenységéből.

  • @PittMex
    @PittMex Před 2 lety

    Akkor végérvényben az F érték ugyanazt mutatja mint az Adjusted R^2?? azaz mennyire általánosítható a populációra?

    • @stathelp
      @stathelp Před 2 lety

      Nagyon jó megfigyelés! Az adjusted R2 az F-értékhez hasonlóan figyelembe veszi a modell bonyolultságát (paraméterek számát) és az elemszámot. A korrigálatlan R2 a négyzetösszegekből számolható, a adj. R2 a négyzetátlagokból, hasonlóan az F-értékhez. Ha a számítást nézed, az korrigálatlan R2 = SS(model) / SS(total) = 1 - SS(residual) / SS(total). Ezzel szemben az Adjusted R2 = 1 - MS(residual) / MS (total), ahol az MS(residual) = SS(residual) / df(residual) és az MS(total) = SS(total) / df(total). Ha megnézed az F-érték számítását, az is a négyzetátlagokat használja, mivel F = MS(model) / MS(residual). Ennek megfelelően az adj. R2 az F-értékhez hasonlóan fog mozogni. Például kicsi elemszámnál hiába nagy esetleg a korrigálatlan R2-érték, az F-érték és a adj R2 is kicsi lesz, hiszen mindkettő figyelembe veszi a kis elemszámot.

  • @PittMex
    @PittMex Před 2 lety

    Az Anderson-Darling normalitás teszt is hasonlóan érzékeny a nagy minta elemszámra?

    • @stathelp
      @stathelp Před 2 lety

      Az Anderson-Darling egy igen érzékeny teszt. Mellette nagyon kell vigyázni vele, mert ha sok azonos érték van a mintában, nagyon könnyen szignifikáns eltérésre juthatunk vele - ugyanerre a S-W és a K-S nem érzékeny annyira.