![Klára Soltész-Várhelyi](/img/default-banner.jpg)
- 450
- 808 583
Klára Soltész-Várhelyi
Hungary
Registrace 28. 03. 2009
Statisztika kurzus pszichológia szakos hallgatóknak.
A felvételek Excel és SPSS használatához fognak elméleti és gyakorlati ismereteket tartalmazni.
Weboldal: stathelp.hu
Témák:
- Excel ismeretek
- SPSS ismeretek
- JASP ismeretek
- Statisztikai alapfogalmak
- Adattisztítás, parametrikusság
- Korreláció
- T-próbák
- One-way ANOVA, ANCOVA, Többszempontos variancia analízis, Repeated Measures
- Regresszió elemzés
- Moderációs és mediációs elemzés
- Faktoranalízis és főkomponens-elemzés
- Diszkriminancia elemzés
A felvételek Excel és SPSS használatához fognak elméleti és gyakorlati ismereteket tartalmazni.
Weboldal: stathelp.hu
Témák:
- Excel ismeretek
- SPSS ismeretek
- JASP ismeretek
- Statisztikai alapfogalmak
- Adattisztítás, parametrikusság
- Korreláció
- T-próbák
- One-way ANOVA, ANCOVA, Többszempontos variancia analízis, Repeated Measures
- Regresszió elemzés
- Moderációs és mediációs elemzés
- Faktoranalízis és főkomponens-elemzés
- Diszkriminancia elemzés
ANOVA elmélete 09 - ANOVA mutatóinak összegzése
ANOVA elmélete 09 - ANOVA mutatóinak összegzése
zhlédnutí: 1 899
Video
ANOVA elmélete 08 - F-érték (illetve Mean squares of Model és Residuals) számítása
zhlédnutí 1,3KPřed 3 lety
ANOVA elmélete 08 - F-érték (illetve Mean squares of Model és Residuals) számítása
ANOVA elmélete 07 - Sum of Squared Residuals számítása
zhlédnutí 1,1KPřed 3 lety
ANOVA elmélete 07 - Sum of Squared Residuals számítása
ANOVA elmélete 06 - R-négyzet, eta-négyzet, omega-négyzet
zhlédnutí 1,6KPřed 3 lety
ANOVA elmélete 06 - R-négyzet, eta-négyzet, omega-négyzet
ANOVA elmélete 05 - Predikált érték és Sum of Squares of Model számítása
zhlédnutí 1,4KPřed 3 lety
ANOVA elmélete 05 - Predikált érték és Sum of Squares of Model számítása
ANOVA elmélete 04 - Referencia modell és Sum of Squares of Total számítása
zhlédnutí 1,9KPřed 3 lety
ANOVA elmélete 04 - Referencia modell és Sum of Squares of Total számítása
ANOVA elmélete 03 - Függő és független változó
zhlédnutí 2,2KPřed 3 lety
ANOVA elmélete 03 - Függő és független változó
ANOVA elmélete 02 - Familywise error, azaz többszörös tesztelés ára
zhlédnutí 2,1KPřed 3 lety
ANOVA elmélete 02 - Familywise error, azaz többszörös tesztelés ára
ANOVA elmélete 01 - Független és összefüggő mintás, egy- és többszempontos ANOVA
zhlédnutí 6KPřed 3 lety
ANOVA elmélete 01 - Független és összefüggő mintás, egy- és többszempontos ANOVA
Mediációs elemzések 11 - Mediáció JASP-ben 2/2
zhlédnutí 987Před 3 lety
Mediációs elemzések 11 - Mediáció JASP-ben 2/2
Mediációs elemzések 10 - Mediáció JASP-ben 1/2
zhlédnutí 1,3KPřed 3 lety
Mediációs elemzések 10 - Mediáció JASP-ben 1/2
Mediációs elemzések 09 - Ábra és táblázat mediáció publikálásához
zhlédnutí 850Před 3 lety
Mediációs elemzések 09 - Ábra és táblázat mediáció publikálásához
Mediációs elemzések 08 - Változók típusa mediációban
zhlédnutí 451Před 3 lety
Mediációs elemzések 08 - Változók típusa mediációban
Mediációs elemzések 07 - Mediáció útvonalainak értelmezése
zhlédnutí 719Před 3 lety
Mediációs elemzések 07 - Mediáció útvonalainak értelmezése
Mediációs elemzések 06 - Mediáció beállításainak kérdései - kell-e standardizálni?
zhlédnutí 658Před 3 lety
Mediációs elemzések 06 - Mediáció beállításainak kérdései - kell-e standardizálni?
Mediációs elemzések 05 - Mediáció-számítás módszerei (OLS regression és SEM)
zhlédnutí 833Před 3 lety
Mediációs elemzések 05 - Mediáció-számítás módszerei (OLS regression és SEM)
Mediációs elemzések 04 - Konfidencia intervallum & szignifikanciaérték mediációban 1/2
zhlédnutí 748Před 3 lety
Mediációs elemzések 04 - Konfidencia intervallum & szignifikanciaérték mediációban 1/2
Mediációs elemzések 03 - Konfidencia intervallum & szignifikanciaérték mediációban 1/2
zhlédnutí 841Před 3 lety
Mediációs elemzések 03 - Konfidencia intervallum & szignifikanciaérték mediációban 1/2
Mediációs elemzések 02 - Direkt és indirekt hatás
zhlédnutí 1,2KPřed 3 lety
Mediációs elemzések 02 - Direkt és indirekt hatás
Mediációs elemzések 01 - A mediáció koncepciója
zhlédnutí 1,5KPřed 3 lety
Mediációs elemzések 01 - A mediáció koncepciója
Moderációs elemzések 07 - Adatok előkészítése moderációhoz JASP-ben
zhlédnutí 665Před 3 lety
Moderációs elemzések 07 - Adatok előkészítése moderációhoz JASP-ben
Moderációs elemzések 06 - Moderációs elemzés és grafikus megjelenítése JASP-ben
zhlédnutí 1,1KPřed 3 lety
Moderációs elemzések 06 - Moderációs elemzés és grafikus megjelenítése JASP-ben
Moderációs elemzések 05 - Adatok előkészítése moderációhoz Excelben
zhlédnutí 920Před 3 lety
Moderációs elemzések 05 - Adatok előkészítése moderációhoz Excelben
Moderációs elemzések 04 - Interakciós tag a regressziós egyenletben
zhlédnutí 882Před 3 lety
Moderációs elemzések 04 - Interakciós tag a regressziós egyenletben
Moderációs elemzések 03 - Moderáció elemzés grafikus ábrázolása
zhlédnutí 806Před 3 lety
Moderációs elemzések 03 - Moderáció elemzés grafikus ábrázolása
Moderációs elemzések 02 - Moderáció (interakció) koncepciója
zhlédnutí 973Před 3 lety
Moderációs elemzések 02 - Moderáció (interakció) koncepciója
Többszörös lineáris regresszió 31 - Publikálás
zhlédnutí 2,2KPřed 3 lety
Többszörös lineáris regresszió 31 - Publikálás
Többszörös lineáris regresszió 30 - Egy teljes elemzés JASP-ben 2/2
zhlédnutí 1,9KPřed 3 lety
Többszörös lineáris regresszió 30 - Egy teljes elemzés JASP-ben 2/2
Többszörös lineáris regresszió 29 - Egy teljes elemzés JASP-ben 1/2
zhlédnutí 3,2KPřed 3 lety
Többszörös lineáris regresszió 29 - Egy teljes elemzés JASP-ben 1/2
Kedves Klára! Ex-pázmányos diákként ismét úgy adódott, hogy ezeket a videókat nézem és egy műhelymunkát írok :) Egyrészt nagyon köszi ezeket a videókat! Másrészt 14:10 környékén azon tanakodom, hogy a df miért egyezik meg az elemszámmal? Nem N-1 a képlet? Nem értem, hogy a 19 elemszámú adatbázisban miért 19 a df. És amúgy az én adatbázisomban is ugyanez a problémám, amikor lehúzom a normalitás teszteket. Nem értem az okát.
Azt a szórásnál tanultuk, de nem mindig N-1 az érték, hanem N mínusz a felhasznált összefüggések száma (a szabad választások számát a felhasznált összefüggések korlátozzák). A szórás számításánál az átlagot használjuk fel összefüggésként, ezért N-1. De ha emlékszel a független mintás t-próbára, ott N-2 volt (a két mintaátlag miatt). A normalitásteszt nem használ fel összefüggést (pl mintaátlagot), csak a minta értékeit, így ott N-0, azaz N a szabadságfok. Remélem segített, és sok sikert a tanulmányaidhoz!
@@stathelp Igen, így már emlékszem és világos, köszönöm!. Valóban, a független mintás t-próbánál stimmel a df=39 (N = 41). Illetve még egy olyan gyors kérdésem van, hogy már lemondtam a független mintás t-próbáról, mert nem jött ki a K-S és S-W teszteken a normalitás az összes csoportomon. Viszont most e videó alapján megtaláltam ezt a cikket: Orcan, F. (2020). Parametric or non-parametric: Skewness to test normality for mean comparison. International Journal of Assessment Tools in Education, 7(2), 255-265. Itt a 2. oldal felétől az van, amit te is mondasz tk., hogyha csak enyhén csúcsos és enyhén ferde, mégis feltételezhető a normális eloszlás és mégis használható a független mintás t-próba a Mann-Whitney helyett. A mintám csoportjain kiszámoltam és az összesnél .001 < Z < 1.1, tehát 1.96 alatti, azaz ha jól értem, mégis használhatom a függ. mintás t-próbát. Ezt jól értelmezem?
Azon gondolkoztam, hogy mit lehet akkor tenni, ha például three-way ANOVA-t szeretnénk elvégezni, de a faktorkombinációk néhány szintjén nem teljesül a normalitás? Sajnos a nem parameteres verziók az általam ismert szoftverekben nem képesek háromutas dolgokra, az interakciókról nem is beszélve. Vagy csupán a reziduálisokkal érdemes ilyenkor torődni, nen a "nyers adatokkal"? Persze a kérdés még akkor is érvényes: mit lehet vajon alkalmazni two vagy three way anova helyett, ha semmilyen módszerrel semmi sem normális eloszlású?
Jesszusom ez a videó sorozat most megment, Statistics 2-t hallgatok jelenleg angolul de az anyagot keszekuszán adták le nem úgy mint itt tömören mégis részletesen és érthetően KÖSZÖNÖM!!
Az alábbi jelenséggel találkoztam ma, ami az outlierek detektálását illeti: 1. 5 prediktort emelek a modellbe 2. Azonosítottam a többdimenziós kiugró értékeket Cook's distance alapján. Töröltem őket. 3. Az 5 prediktorból egyet kiveszek, mert nem felel meg a feltételeknek. Maradt 4 prediktor. 4. Kíváncsiságból megnéztem, hogy az előbb kitörölt outlier Cook értéke milyen akkor, ha rögtön az előbb említett 4 prediktort emelem a modellbe. Ebben az az esetben már éppen nem outlier, de más megfigyelések outlierré váltak. Ismét szedjem őket ki? Hol van ennek a lépésnek, az outlier detectionnek a helye a flowban? Minden prediktor bevonásánál/eltávolításánál végezzem el? De akkor hol van ennek a vége? Nem lenne érdemes a "körkörös analízis" hibájába esnem. Nem szeretnék egy túlillesztett modellt kapni, és nincs nincs elég elemszám egy teszthalmazhoz. :(
Leginkább azt tudom tanácsolni, hogy ne mechanikusan csináld a dolgot, hanem elméleti szepontból is mérlegelve, mennyi embert veszel ki. A másik, hogy valószínűleg gyenge lehet a modell (túl kicsi elemszám és/vagy túl nagy kollinearitás és/vagy túl gyenge hatások). Ha ennyire kis változtatásokkal ekkora változás történik az értékekben (pl. a Cook-értéket nem könnyű átlökni a problémás oldalra), akkor az általában gyenge modellre utal. A problémás aspektust próbált javítani (nyilván elemszámot nem lehet, de a változók kiválasztását igen)!
Köszönjük!
Én köszönöm!
minden girbe-gurba eloszlás nevében köszönöm ezt a videót!
Köszönjük!
Köszönöm szépen!
Tegyük fel, hogy meg szeretném tudni, hogy egy folytonos változó átlaga szignifikáns különbséget mutat-e két csoport között. Azt már tudom, hogy a két csoport szórása szignifikánsan különbözik. És itt jön az, amit nem értek. Ha van két mintám, aminek a szórásai szignifikánsan különböznek, az nem jelenti, hogy a két mintám két eltérő eloszlású populációból származik? Ezek után, ha az átlagok különbsége nem is lesz szignifikáns, a két minta akkor sem ugyanabból a sokaságból jön, nem?
Nagyon jó meglátás! Azonban: 1) itt a paraméteres próbák feltételeinek ellenőrzését tanuljuk, a sorozat elején elhangzik, hogy a két orvosi lovunk a Pearson korreláció és a klasszikus független mintás t-próba. Ez utóbbi esetén a minták eltérése a középértékek közötti eltérésre (azaz shift-re) vonatkozik. 2) majd akkor, amikor a minták eltérését tanuljuk, meg fogjuk tanulni, hogy két minta nem csak a középértékében térhet el (ezen belül is, nem csak átlagában, hanem mediánjában is, mely megint egy másik próba), hanem eltérhet szórásában (ennek egyik lehetséges tesztelése a Levene teszt), vagy például az eloszlás alakjában is (erre jó a két-mintás Kolmogorov-Smirnov). 3) A legtöbb kutató amikor eltérésről beszél, csupán a középértékek közötti eltérésre gondol, csak azt vizsgálja. Ennek ellenére rendkívül érdekes lehet az is, ha a szórások térnek el - hiszen az azt jelenti, hogy az egyik minta valamiért heterogénebb. Hogy mondjak egy valós példát erre: az IQ nemi különbségei. Jelenleg azt gondoljuk, hogy az átlag (vagy medián) IQ nem tér el férfiak és nők között, de a férfaiknál sokkal nagyobb az IQ szórása, azaz belőlük inkább kerülnek ki zsenik (nem véletlen, hogy a legnagyobb tudósaink, iróink, stb. inkább férfiak) de az idióták is (erre is lehet példát találni bőven). Mindennek izgalmas evolúciós, illetve idegrendszeri magyarázata is van.
Nagyon köszönöm! Érthető.
1:32 😂🤣
A koefficiens nem csak a b1? Így nem két koefficiens, hanem csak egy koefficiens és egy konstans van? Az ábrán az szerepel, hogy "ezeket nevezzük a két regressziós együtthatónak". Mellesleg ezer köszönet a videókért, tökéletesen, érthetően elmagyaráznak mindent, rengeteget tanulok belőlük! Életmentők!
A b0-t is gyakran koefficiensnek nevezzük, ez az intercept vagy konstans. A b1 is koefficiens, ez a meredekség (slope). Örülök, ha segítettek. Sok sikert a tanulmányaidhoz!
Kedves Klára! Szuperek a videók. Még nem néztem mind végig, de az lenne a kérdésem, hogy a Jasp tud olyan változókat kezelni, amelyek tartományokat tartalnaznak? Pl osztályzatnál, hogy 0-10 pont = 1-es. Ha igen, akkor hol és hogyan jelenik itt meg? Hogyan lehet be/átállítani? Köszönöm!
Orulok neki, hogy magyarul is van fent oktato tartalom statisztikabol. Koszi, hogy ennyi energiat fektettel bele.
+ 1 😊👍
Kedves Klára! Milyen próbát alkalmazzunk ha sem a szóráshomogenitás, sem a normalitás nem teljesül a mintákon? Válaszát előre is köszönöm!
Ez leginkább a konkrét adatok eloszlásától függ, de általánosságban elmondható, hogy skála mérési szint mellett a normalitás sérülésekor legtöbbször valamilyen rangsorolásos eljárást választunk (pl. Spearman, Mann-Whitney, Wilcoxon), és a rangsorolás a szóráshomogenitás sérülését is viszonylag jól kezeli. Fordítva ez nem igaz - a szóráshomogenitás sérülésének kezelésére kitalált korrekciók (pl. Welch-teszt) nem alkalmasak a normalitás sérülésének kezelésére.
Ezt le kell írnom valahová. "A Khi2 definíciója gyakorlatilag: normál eloszlást követő változók négyzetre emelt értékének összegzésének eloszlásának leírására alkalmas eloszlás." 🐱 Imádom <3
Örülök hogy rátaláltam csatornádra. Lényegretörő, érthető videók. Nagyon hasznos, köszönöm!
Köszönöm szépen az érthető és nagyon részletes segítséget! Rengeteget segít a szakdolgozatom statisztikai részének megírásában!!:)
Kedves Klára! Egy olyan kérdésem lenne, hogy milyen vizsgálatoknál lehet, és milyen vizsgálatoknál nem lehet a Likert skálát Skála mérési szintűnek tekinteni? Illetve, ha annak tekintjük, akkor az eredményezhet-e hibákat, és milyeneket? Válaszát előre is köszönöm!
A legtöbb kérdőív likert-skálát használ az itemekhez - ezeken minden meghökkenés nélkül el szoktuk végezni a reliabilitás vizsgálatot, mely korrelációkon alapul, illetve össze szoktuk adni / átlagolni utána az itempontszámokat - pedig, ha belegondolsz, ordinális változókat szigorú értelemben véve nem lehet összeadni. Ezzel szemben, egy nem vennék be Likert-skála változót parametrikus teszt (pl.t-próba, ANOVA Pearson-korreláció vagy regresszió) függőváltozójaként - egyszerűen azért sem, mert nem kellően folytonos (nem vehet fel kellően sokfajta értéket) ahhoz, hogy a normáleloszlás kialakulhasson. Egy tízfokú Likert-skálán már viszont -ha nagyon muszáj - el lehet gondolkodni parametrikus teszteknél is
@@stathelp köszönöm a választ. Azért kérdezem, mert találtam olyan cikkeket is, amik szerint használhatók a paraméteres tesztek is Likert skálák esetén, mivel ezek a tesztek eléggé robosztusak, illetve sok évtizedes gyakorlat van mögötte. Erről mit gondol? Illetve láttam olyan gyakorlatot, is, ahol a likert skálák értékeinek összegzésével képeztek új változót. Ez jó módszer lehet? Illetve alkalmas lehet összefüggés-vizsgálatra?
Ez egy méltatlanul alábecsült csatorna, pedig a magyarázat mennyisége és minősége kiemelkedik nemcsak a magyar, de az angol nyelvű anyagok közül is.
Köszi! 30 évvel ezelőtt, amikor kérdezhettem volna, nem tudtam jól megfogalmazni, hogy miért zavar a négyzetre emelés, miközben a közönséges abszolút érték ugyanúgy elnyomná az ellenkező előjelek egymást közömbömbösítő hatását, és sosem volt rá érdemi magyarázat - a nagy eltérések még nagyobbra torzításán kívül, amit kicsit művinek éreztem -, amikor valstatba botlottam. A deriválhatóságra nem gondoltam. Tényleg köszönöm, öregkoromban nyugodtabban fogok aludni végre.
Köszönöm, hogy készítesz ilyen videokat! Megtalált hiba: 0,09% esély 100darabos mintavételezésnél. (egy tizedes elcsúszott)
Köszi, megment ez melóban holnap
Nagyon hasznos videók, köszönjük!
Szuper az összes videó, nagy nagy köszönet érte!
Kiit ért kontroll személyek alatt?
nagyon jól érthető. pont egy hobbi projektemhez van szükségem erre és eddig totál black magic volt ez az egész. ezekkel a videókkal már egyre jobban értem. hiánypótló! :)
tök jól érthető. köszönöm! :)
Nagyon jól érthetően elmagyarazza a videóban. Nekem sokat segített
Nagyon hálás vagyok ezekért a videókért! Egy Istennő vagy!!!!!!!!!!!!!!!
Köszönöm a segítséget :)
Nálam mindkét oszlopot ugyanarra a tengelyre teszi. A másikat meg beszámozza: 1,2,3 ... Az enyémet valami down-kórosok írták.
Nagyon sokat segítenek a videóid, átlátható minden. Köszönöm!
Kedves Klára! Tudnál kérlek abban segíteni, hogy az elméletileg lehetséges minimum és maximum az mennyiben más mint a sima minimum és maximum? Nagyon szépen köszönöm!!
Sokat tanultam Öntől, köszönöm.
Remek, hogy létrehozta a csatornát! Az életemet menti meg az egyetemen! Volt értelme vele dolgozni és nagyon szép munka :D
Én nagyon várom a folytatást. Ez a csatorna sokkal többet segített, mint az összes statisztika kurzusom összesen.
Ugyanezt gondolom én is!
A szabadságfokkal osztott varianciánál az eredmény 0,2777, de 0,777-et mondasz. :)
Köszönöm a videókat nagyon hasznos!!
Tiszta, érthető és érdekes előadás. Nagyon okos előadó! Köszönöm.
Köszönöm a visszajelzést!
Kedves Klára! Nagyon szépen köszönöm a videót, hihetetlenül hasznos. Lehet, hogy én nem figyeltem megfelelően, de mintha végül nem tértél volna ki a H0 sorok jelentőségére és értelmezésére. Bár azt látom, hogy a publikálásnál már törlöd őket. Erről tudsz pár szót ejteni? Nagyon köszönöm!!
Kedves Mihály! Örülök, ha hasznosnak érezted! A H0 sorok majd a hierarchikus regressziónál lesznek fontosak. Néhány (jópár) videóval arrébb lesz róla szó (nem is kevés).
@@stathelp Kedves Klára! Nagyon szépen köszönöm!
Egészen hasznos is lenne a dolog, de legalább a címet írjük már le helyesen! *Többszörös*
Már nincs tobb video.. :(
Le a kalappal előtted, ha mind a 400-500-at végignézted. Tavasszal várhatóan folytatom majd az ANOVA sorozatot. Illetve ha lesz rá kapacitásom, lesz egy főkomponens sorozat is :)
Kuldtem emailt..
Köszönjük szépen, alapos munka!
Hát erre a sorozatra és csatornára most akadtam rá..Hiánypótló és életmentő!
Köszönöm!
az életem mentik meg ezek a videók, köszönöm! üdv, egy eltés gólya
Sok sikert a tanulmányaidhoz!
Én azt nem értem hogy ha teljesul a CLT, akkor ez azt is jelenti hogy innentol kezdve normal eloszlasnak tekinhetem a populáciot s ez felhatalmaz hogy t-probakat is vegezhetek , még akkor is ha a populáciorol pl eros a gyanum hogy nem normegyenletes eloszlast kovet? Mennyire helyes ez a megkozelites
Ez egy nagyon jó kérdés, és a téma heves internetes viták alapja. Először is a központi határeloszlás tételnek nagyon sok mindenben van szerepe (gyakorlatilag ezért működik a statisztika): 1) részben felelős azért, hogy sok tulajdonság a populációban normál eloszláshoz közelítsen, mert a tulajdonságokat sokminden befolyásolja. Ettől még nem biztos, hogy a tulajdonságot az általam vett mérőeszközön keresztül is normáleloszlásúnak fogom látni (itt most nem a mintavételezés bizonytalanságáról beszélek, hanem kifejezetetten arról, ahogy a tulajdonságot mérem), mert sok mérőeszközünk van, mely nem egyforma felbontásban mér a tulajdonság teljes tartományán (pl. perfekcionizmus skála, mely a magasan perfekcionisták részén jól mér, a kb. normál tartományban viszont padlóhatás miatt egy csomó embert összemos). 2) a predikciónk hibájának normáleloszlását hozza létre (regressziós videóban részletesebben: ha a modelltől független a sok egyéb tényező, mely a hibát, zajt létrehozza, akkor a zaj normál eloszlást fog követni). 3) sok próba valóban robusztusabbá válik nagyobb elemszámon a normalitás sérülésére. Itt az a nehéz, ez a robusztusság különböző sérülésfajtáknál eltérő elemszámnál válik kellően erőssé. Pl. t-próbánál mindkét minta ugyanabba az irányba ferde - viszonylag kis elemszámnál is már robusztus a t-próba. A két minta eltérő irányba ferde: akár több ezer főnél sem az. Szóval óvatosan azzal, amikor a normalitás sérülése ellenére t-próbát használsz a CLT-re hivatkozva. Sokszor teljesen rendben van, néha meg nagyon nem. Inkább azt szoktam tanácsolni, hogy vizsgáld meg, hogyan sérül a normalitás (hisztogram, Q-Q plot, ferdeség, csúcsosság segítségével), és a robusztussági szakirodalmat figyelembe véve dönts arről, használhatsz-e t-próbát ennek ellenére. (itt továbbra is a központi határeloszlásnak köszönheted, ha a robusztusság kialakult, de nem vakon arra hagyatkozva döntesz)
Olvastam hogy a Khi2 teszt alkalmas lehet egyenletes eloszlás tesztelésére. Viszont ez eléggé érzékeny mivel nagy elemszámnál gyakran elveti a H0 hipotézist, kis elemszámnál pedig elfogadja hogy a minta egyenletes eloszlást kovet holott grafikusan kétségbe vonható :D
Igen, többek között arra is jó, a videóban csak néhány példát hozok, ennél sokkal több helyen használjuk! Sok goodness-of-fit elemzésben megjelenik a Khi2 eloszlás, ahol egy mért és valamilyen modell által implikált eloszlás hasonlóságát teszteljük, az uniform eloszláshoz való hasonlóság vizsgálata is ilyen. És valóban a legnagyobb probléma az szokott lenni, hogy nagy elemszámokon túlérzékeny, kis elemszámokon pedig a komplexitás növekedésével gyorsan veszít érzékenységéből.
Akkor végérvényben az F érték ugyanazt mutatja mint az Adjusted R^2?? azaz mennyire általánosítható a populációra?
Nagyon jó megfigyelés! Az adjusted R2 az F-értékhez hasonlóan figyelembe veszi a modell bonyolultságát (paraméterek számát) és az elemszámot. A korrigálatlan R2 a négyzetösszegekből számolható, a adj. R2 a négyzetátlagokból, hasonlóan az F-értékhez. Ha a számítást nézed, az korrigálatlan R2 = SS(model) / SS(total) = 1 - SS(residual) / SS(total). Ezzel szemben az Adjusted R2 = 1 - MS(residual) / MS (total), ahol az MS(residual) = SS(residual) / df(residual) és az MS(total) = SS(total) / df(total). Ha megnézed az F-érték számítását, az is a négyzetátlagokat használja, mivel F = MS(model) / MS(residual). Ennek megfelelően az adj. R2 az F-értékhez hasonlóan fog mozogni. Például kicsi elemszámnál hiába nagy esetleg a korrigálatlan R2-érték, az F-érték és a adj R2 is kicsi lesz, hiszen mindkettő figyelembe veszi a kis elemszámot.
Az Anderson-Darling normalitás teszt is hasonlóan érzékeny a nagy minta elemszámra?
Az Anderson-Darling egy igen érzékeny teszt. Mellette nagyon kell vigyázni vele, mert ha sok azonos érték van a mintában, nagyon könnyen szignifikáns eltérésre juthatunk vele - ugyanerre a S-W és a K-S nem érzékeny annyira.
P