Zweiter Teil zum t-Test: Hier erkläre ich, wie der für zwei unabhängige und auch zwei verbundene Stichproben funktioniert. Musik und Soundeffekte: CZcams Audio Library
Mal schauen, wie es ausgeht. Wenn es Internet im Himmel geben sollte, melde ich mich. Wenn ich mich nicht melde, gibt's entweder kein Internet oder es hat nicht geklappt mit dem Himmel :o) LG und danke fürs Kommentieren!
Dank Ihrer Videos ist mir in meiner Six Sigma Black Belt Zertifizierung etliches klarer und verständlicher geworden. Wirklich super. Und die wahnsinnige Mühe, die Sie sich machen. Noch nie habe ich Statistik so leicht erklärt gesehen. Übrigens finde ich die lustige Musik super - die lockert das trockene Thema absolut auf. Oft sitze ich hier und schmunzel :-) Thx to you!
Hey, das freut mich sehr, dass ich auch bei fortgeschrittenen Anwendern noch ab und zu unterstützen kann! Vielen Dank für das liebe Feedback und viel Erfolg!
Ich studiere Geographie und habe jetzt im Modul Statistik, Dank Ihrer Videos, eine 2.0 erreicht, normalerweise waren meine Leistungen in Mathe bisher immer sehr bescheiden. Sie bringen den Stoff wirklich sehr verständlich und interessant herüber, vielen Dank für Ihre Videos ! :)
Hey, das freut mich sehr, was für ein schönes Feedback! Ich hoffe, dass die Statistikgrundlagen auch noch im Rest des Studiums nützlich sein werden (bin ich eigentlich fast sicher, spätestens, wenn es an Thesis geht) und wünsche noch viel Erfolg!
Witzig, dass diese Videos genau jetzt kommen wo das 2. Semester Statistik gerade hinter mir liegt. Die Videos werden allerdings alle als auffrisch Material genutzt, es steht ja noch Statistik 3 bevor. Schön, dass es sich doch noch gelohnt hat diesen Kanal zu abonnieren, gute Arbeit und weiter so. :)
Ich hab' alles gegeben, um es noch vor der Klausur fertig zu bekommen und dann doch nicht geschafft O.O ... nein, Spaß, die Produktion von so einem Video ist ziemlich aufwendig und ich muss es halt dahin packen, wo es zeitlich passt. Immerhin hatte ich ja vorher auch schon ein paar Videos am Start ;o) ... Statistik DREI??? Ihr werdet ja ganz schön rangenommen. Richtig so. :D ... danke fürs Abonnieren und Kommentieren jedenfalls und LG!
Hey, vielen Dank für deine Videos! Ich habe eine Frage zur Nullhypothese: Geht diese nicht normalerweise davon aus, dass die Mittelwertsunterschiede zufällig sind, also der Unterschied im Umsatz der verschiedenen Automaten nicht auf die Vorteile des Designerautomaten zurückzuführen sind und er sich darum nicht lohnt? Ich hätte vermutet, dass die H0 (bei einseitiger Testung) wie folg lautet: Mittwelwert_Design - Mittelwert_Normal = 0 und stattdessen die H1 lautet Mittelwert_D - Mittelwert_Normal >= 800. Oder trifft das nur auf Einstichproben zu?
wow, danke für diese tolle Video-Serie, ich habs verstanden! :) Sie haben wirklich ein Talent, Sachverhalte eindeutig zu erklären! Ich sitze gerade an meiner Bachelorarbeit zum Thema "automatisierte kontenbasierte Klassifikation von Konto-Umsätzen" und hab dazu eine Frage bezüglich des Paardifferenzentests. Ich habe ein Konto mit N klassifizierten Umsätzen. Ich lerne damit verschiedene Modelle (Entscheidungsbaum, naiven Bayes, Neuronale Netze) an und möchte die Fehlerrate der Klassifizierer vergleichen. Da würde sich ja zunächst mal der Paardifferenzentest anbieten um die Fehlerraten zu vergleichen bzw. zu entscheiden ob die Fehlerrate eines Klassifizierer "höher" ist als die des anderen. Allerdings sind die N Umsätze nicht nur eine Stichprobe (also eine Teilmenge), sondern tatsächlich ALLE Umsätze, die es auf diesem Konto gibt, also die Grundgesamtheit. Ergibt nun der Paardifferenzentest in diesem Szenario trotzdem noch Sinn oder kann ich im Falle, dass die Fehlerraten zweier Grundgesamtheiten vorliegen, "einfach so" die Zahlen miteinander vergleichen, ohne den Test? Die Klassifikation bezieht sich tatsächlich auch nur auf dieses Konto und nicht auf potentiell andere Konten. Über eine Antwort wäre ich Ihnen sehr dankbar. Keep doing it!
Hallo Matthias, vielen Dank für das liebe Feedback! Die Frage, die sie haben, hat viele Facetten und lässt sich deswegen nicht in Kürze abschließend beantworten. Ich will aber versuchen, ein paar Denkanregungen zu geben. 1. Sie sprechen eine wesentliche Grundsatzfrage an: Statistische Tests sind dazu da, um Aussagen zu Grundgesamtheiten zu testen, wenn man nur auf eine Stichprobe zurückgreifen kann. Kennt man die ganze Grundgesamtheit (und kann man sie auch auswerten), braucht man eigentlich keinen Test. Die Frage ist aber: Kenn Sie wirklich die ganze Grundgesamtheit? Wird es also zum Beispiel in der Zukunft keine weiteren Umsätze mehr geben, die Sie heute noch nicht kennen (und die Sie eventuell mit Ihrem Modell vorhersagen möchten)? 2. Selbst wenn die Antwort auf die erste Frage "ja" ist, möchten Sie sicher trotzdem noch die Zuverlässigkeit der Modelle gegeneinander vergleichen: - Ein übliches Verfahren wäre hier z.B. eine Confusion Matrix (auf deutsch: Wahrheitsmatrix: de.wikipedia.org/wiki/Beurteilung_eines_bin%C3%A4ren_Klassifikators#Wahrheitsmatrix:_Richtige_und_falsche_Klassifikationen), mit welchem einfach die Zahl der richtigen und falschen Klassifikationen verglichen wird. - Da Sie Umsätze (also ein quasi-stetiges Merkmal) klassifizieren möchten, wäre vielleicht eine ROC-Kurve sinnvoll (de.wikipedia.org/wiki/Receiver_Operating_Characteristic). 3. Bei Modellen ist es üblich, einzelne Parameter auf Verschiedenheit von 0 zu testen (ist ein Parameter nicht signifikant verschieden von 0, kann er aus dem Modell entfernt werden). Als Rechtfertigung für derartige Tests könnte man bei Ihnen anführen, dass jeder Umsatz in Ihrem Datensatz ja auch leicht anders hätte ausfallen können, also selbst nur die Realisation einer Zufallsvariablen ist. Mit derselben Begründung können Sie eventuell auch den Test der Fehlergrößen gegeneinander verwenden: Wenn die Umsätze (und die Vorhersagevariablen) als Zufallsgrößen gedeutet werden können, dann wären auch die Parameter der resultierenden Modelle zumindest zum Teil Ergebnis eines Zufallsexperiments, und damit auch die Modellvorhersagen. Damit würde gelten: Nur, wenn die Modellvorhersagen eines Modells signifikant besser als die eines anderen Modells sind, sollte man es dem anderen Modell vorziehen ... insbesondere dieser letzte Punkt ist bitte als Denkanstoß zu verstehen; man müsste nochmal im Detail überlegen, ob das so passt. Ich hoffe, trotzdem geholfen zu haben ... viele Grüße und viel Erfolg!
Vielen Dank für das verständliche Video. Im Paardifferenzentest sagst Du allerdings, dass es üblich sei die Nullhypothese so zu formulieren, dass es "keinen Unterschied gäbe" also in dem Beispiel µ = 0. Im Zweistichprobentest haben wir die Nullhypothese allerdings so formuliert, dass die Maßnahme den Designerkühlschrank zu nutzen einen Effekt hätte (µ >= 800). Für mich sind das widersprüchliche Aussagen. Verstehe ich etwas falsch?
Mit "üblich" meine ich, dass man das sehr oft (man könnte fast sagen, standardmäßig) so macht, weil man meistens keine konkrete Ansicht zum Unterschied hat und deswegen testet, ob man die Hypothese "Es gibt keinen Unterschied." (also µ = 0) beibehalten kann oder verwerfen muss. Das heißt aber nicht, dass man das immer so machen muss. Wenn man eine konkrete Annahme hat (oder eine Forderung, wie z.B. 800,- EUR im Video), kann man auch das als Nullhypothese wählen. LG!
Könntest Du ein Video zum Maximum-Likelihood-Schätzer und dessen Herleitung machen? Super gute Videos übrigens! Einsame Spitze auf dem Gebiet hier auf CZcams!
Hallo Nadine, am besten suchen Sie sich einen beliebigen Merkmalsträger aus der ersten Stichprobe. Wenn Sie zu diesem einen (ziemlich offenischtlichen) Partner in der zweiten Stichprobe finden können, handelt es sich vermutlich um abhängige Stichproben.
warum ist das hier ein linksseitiger test? und lautet die h1 nicht mü(design)-mü(normal)=grössergleich 800? ich dachte, das was man testen möchte ist immer h1? vielen lieben dank für deine tollen videos und all die mühe die dahinter steckt!!!
Ist auf jeden Fall Unsinn. Die Alternativhypothese H1 meint normalerweise die Vermutung, die Nullhypothese die Ausgangssituation, dass etwas keinen Einfluss hat oder gleich ist.
Vielen Dank für das Video. Bei mir sieht die Formel im Buch irgendwie anders aus: (Durchschnitt von x1-Durchschnitt von x2) /Bruch Standardfehler. Kann man das so auch machen für den zwei Stichprobentest zweiseitig ?
Müsste ich sehen. So beschrieben klingt die Formel recht kurz. Fakt ist aber, dass man die Formel auf alle möglichen Arten umstellen kann und in den verschiedensten Formen in Formelsammlungen findet.
Vielen Dank für deine Videos! Die helfen echt super gut weiter! Kommen denn mal wieder neue? Ich würde mir nämlich das Thema Pearsonscher Korrelationskoeffizient und Spearmanscher Rangkorrelationskoeffizient wünschen. Liebe Grüße
Zum metrischen Korrelationskoeffizienten habe ich schon ein Video gemacht: czcams.com/video/IwJ7RPIAxUo/video.html Der Wunsch zur Rangkorrelation ist notiert!
Sehr gut aufgebautes Video gut zu verstehen! Habe aber eine Frage zum Obst Beispiel. Wenn Max jetzt wie im Beispiel aber mehrere Kisten einer Gruppe z.B. Orangen mit und ohne UV-Licht untersuchen wollte, müsste er dann für jede Gruppe also Bananen; Orangen... den Zweistichproben test anwenden oder könnte er den Paardifferenzentest mit den Mittelwerten anwenden?
Hallo Daniel, danke für das Feedback! Es kommt immer darauf an, wie man das Experiment aufbaut. 1. Man könnte z.B. fragen, ob das Licht bei Bananen hilft und dann mehrere Bananen mit und mehrere ohne Licht lagern. 1a) Wenn man dann keine Paare bilden kann (ich kann nicht eine Banane der ersten Menge nehmen und sofort sagen, welche Banane der zweiten Menge dazu gehört), würde man den Zweistichproben t-Test nehmen. 1b) Wenn ich es doch kann (z.B. aufgrund der Größe, ob sie oben/unten/in der Mitte lag, ihres Herkunftslandes etc.), wäre es wieder der Paardifferenzentest. Daran sieht man auch, dass man eventuell ein Kriterium der Zusammengehörigkeit übersehen könnte - man muss einfach sorgfältig über die Situation nachdenken; ein komplett formales Kriterium kann es nicht geben. 2. Wenn man das Experiment so aufbaut, wie ich Ihren Vorschlag verstehe (eine Kiste Bananen mit/eine ohne, eine Kiste Orangen mit/eine ohne usw.), für jede Kiste einen Mittelwert feststellt, und dann die Mittelwerte der Mittelwerte gegeneinander testet, hätte man trotzdem verbundene Stichproben (also Paardifferenzentest), weil ich ja wieder Mittelwertpaare bilden kann (ich weiß übrigens nicht aus dem Stegreif, ob Mittelwerte aus Mittelwerten noch t-verteilt sind, glaube aber schon). Ein wesentlicher Punkt, den man aus den Überlegungen mitnehmen kann, ist: Man sollte sich unbedingt bei der Entwicklung des Experiments überlegen, wie man es eigentlich auswerten will und den Versuchsaufbau so wählen, dass die Sachlage möglichst eindeutig ist. LG!
Gern geschehen. Danke für die Antwort. Ja genau wie in 2. hatte ich das gemeint. Ich schreibe gerade an meiner Bachelor Thesis und habe genau das Problem zu sagen ob es einen signifikanten Unterschied gibt oder nicht. Vielen Dank noch mal. Freue mich schon auf Ihr nächstes Video
Vielen Dank für die Videos! Eine kurze Frage habe ich: Kann es sein, dass in R das von Ihnen benannte Testniveau (z.B. = 0.1 oder 0.05) dem conf.intervall (z.B. gleich 0.9 oder 0.95) entspricht?
Hallo Dominik, im Prinzip haben die beiden Sachen ziemlich viel miteinander zu tun, aber von Konfidenzintervallen spricht man eher beim Schätzen: czcams.com/video/DdwTa28W4Os/video.html LG und viel Erfolg!
Hallo Andy, vielen Dank ... ich glaube, bis zu dem Video schaffen es nur Leute, die es auch wirklich ernst meinen. Die anderen Videos, die man ansehen "muss" haben schon ein paar Dislikes :D ... LG und viel Erfolg!
Hallo, ich habe zwei Fragen: 1. Wie gehe ich mit extrem ungleichen Stichprobengrößen (Messwiederholung = abhängige Gruppen, 2 Zeitpunkte) um? Zum ersten Zeitpunkt habe ich ca. drei mal so viele Daten wie beim zweiten, also ein erhebliches Drop-out. 2. Wie beschreibt man bei einer Bachelorarbeit im Rahmen der Methoden/Datenanalyse den Umgang mit Demografiedaten? Einfach "Es werden deskriptive Statistiken berechnet"? Meine Betreuerin hat angemerkt ich solle noch hinzufügen wie wir "Demodaten analysieren" - Ich glaube damit sind demografische Daten gemeint, will aber auch nicht wegen jeder Kleinigkeit nachfragen. Oder könnte eher sowas gemeint sein, dass man bspw. den Einfluss von Alter, ... testen möchte z.B. durch eine Multiple Regression?... Ich stehe etwas auf dem Schlauch, hoffe ich hab es verständlich beschrieben. Lieben Dank schon mal :)
Hallo Chino, zunächst sind Unterschiede im Stichprobenumfang nicht unbedingt ein Problem, eine hohe drop-out Quote ist allerdings schon eins. Es gibt hier drei Möglichkeiten: 1.) Man kann begründen, dass die die drop-outs unproblematisch weil zufällig sind. Dann kann man oft mit der kleineren Stichprobe normal weiterarbeiten. 2.) Leider stehen drop-out und das, was man untersuchen möchte, häufig im Zusammenhang. Man kann dann versuchen, die Verhältnisse im drop-out Anteil abzuschätzen, indem man die Personen doch noch irgendwie zu einer Aussage bringt, oder indem man auf ähnliche Untersuchungen oder Expertenmeinungen zurückgreift. 3.) Im schlimmsten Fall kann man Extremannahmen treffen und Ergebnisse berechnen einmal unter der Annahme, dass alle drop-outs eine besonders positive Entwicklung zeigen würden und einmal unter der Annahme, dass sie eine besonders negative Entwicklung durchgemacht haben. Ich fürchte aber, dass man bei einer derart hohen drop-out Quote dabei erkennen wird, dass der Datensatz wertlos geworden ist. Bei der Beschreibung der Demografiedaten ist vermutlich gemeint, wie Sie diese erhoben haben und auf welche Art sie analysiert wurden. LG und danke für das Like!
Es handelt sich bei mir um die gleiche Untersuchung, beim 1. Zeitpunkt sind die Fragen retrospektiv gestellt, beim 2. Zeitpunkt beziehen sie sich auf den aktuellen Zeitpunkt. Ich denke das drop-out hängt mit der Länge des Fragebogens zusammen (ca. 1h). Also werfe ich quasi diejenigen raus, von denen ich nur einen Zeitpunkt habe und rechne dann mit dem verkleinerten n weiter?
Hallo Matthias vielen dank für die super Videos, warum wird bei der Hypothese das große mü verwendet wenn wir doch nie die Grundgesamtheit kennen und nur mit dem mittelwert der Stichprobe arbeiten? Wann muss ich wissen wann ich das Gegenteil der null Hypothese formuliere? Weil bisher haben wir die null hypothese so formuliert wie auch der test war? Und woher soll ich wissen das z.b. dieser Fruchttest verbunden ist? Das könnten doch die smoothies auch sein oder nicht? Warum sind diese unabhängig?
Hallo Julia nochmal! Also, das ist ein kleines mü, und das ist der Ansatz beim Testen: Natürlich wissen wir nicht, was der Mittelwert ist, aber wir sagen "Ich stelle die Hypothese auf, dass der Mittelwert 10 beträgt." Danach zieht man eine Stichprobe und stellt fest, ob die Stichprobe zur Hypothese passt. Wenn das vorstellbar ist, behält man die Hypothese bei. Weicht die Stichprobe stark von der Hypothese ab, wird sie verworfen (man hört dann also auf zu behaupten, dass der Mittelwert 10 ist). Zu verbundenen Tests: Das ist das, was ich ab Minute 8:00 erkläre. Natürlich könnten auch die Smoothies zu einer Verbindung führen (z.B. wenn ich Paare gleichen Geschmacks oder Paare gleichen Produktionsdatums habe). Wenn Max den Test mit den Kühlregalen so gemacht hätte, dass er 6 Geschäfte auswählt und dann in jedem Geschäft eine Woche im normalen und eine Woche im Designregal verkauft, hätte er hier auch verbundene Stichproben gehabt, weil über die Geschäfte Paarungen entstehen.
Also ich würde die H0 als H1 aufstellen.. Die H0 geht ja immer davon aus, dass es "keinen Effekt" gibt. Hab ich da was falsch verstanden? Hilfe Mathias!
Hallo Alexis, manchmal liest man, dass H0 _immer_ als "kein Unterschied" formuliert wird. Das stimmt aber nicht - wenn ich prüfen möchte, ob der Unterschied (mindestens) einem bestimmten Wert entspricht, kann ich selbstverständlich auch diesen Wert als H0 formulieren. Wesentlich ist aber: H0 muss ein _konkreter_ Wert sein, weil man sonst keine Testverteilung ableiten kann. Weil man oft glaubt, dass es einen Unterschied gibt, ohne jedoch einen konkreten Wert angeben zu wollen/können, wählt man als H0 "Der Unterschied ist 0.", weil 0 ein konkreter Wert ist. Danach prüft man, ob sich diese Behauptung beibehalten lässt oder nicht (und schlussfolgert im letzteren Fall: es muss einen Unterschied geben). LG und danke fürs Liken und Abonnieren!
Tolles Video, wie immer. Nur gibt es ein kleinen Fehler bei der Formel des Paardifferenztests. Dort heißt es die Wurzel aus 5,5:6. Das stimmt aber nicht, die Wurzel wird nur aus der 6 gezogen, somit wäre die richtige Formel: 5,5/ Wurzel aus 6 = 2,245
Hallo Misshoney, nein, die Formel stimmt schon: - Man zieht nur dann die Wurzel lediglich aus n (hier also 6), wenn im Zähler die Standardabweichung s* steht. - s* ist die Wurzel aus der Varianz s*^2. - Benutzt man wie ich die Varianz s*^2, muss die Wurzel daher über den gesamten Bruch gehen. LG, viel Erfolg und danke fürs Liken!!!
Kurzes Tutorium Statistik ok, verstehe. Aber das Ergebnis sollte doch dann gleich sein, warum bekomme ich dann ein anderes Ergebnis. T ist bei mir dann 1,5/2,25= 0,66
Hallo Herr Bärtl, wäre es in dem Beispiel mit dem Regal nicht besser, die Nullhypothese so zu formulieren, dass wir sagen „... ist kleiner gleich 800“? Sodass wir in der Alternativhypothese zeigen können dass die Differenz bestenfalls größer als 800 ist? Ich kann dann ja mit einer Irrtumswkt. von 10% testen, ob sich das modifizierte Design (was vermutlich auch teurer ist) wirklich lohnt. Können Sie vielleicht kurz erklären, warum Sie die Nullhypothese so formuliert haben ?
Hallo Sabrina, für eine echte Untersuchung mit dieser Fragestellung hätte ich H0 so formuliert, wie Sie es vorschlagen. Ich vermute aber, dass die im Video gewählte Formulierung für Zuschauer, die mit dem Testen noch nicht so vertraut sind, einfacher nachzuvollziehen ist: Ich glaube (hoffe), dass der Umsatz um mindestens 800 Euro höher ist, also formuliere ich die Hypothese dementsprechend. Wenn man dann auf diesem Weg ein Beispiel durchgerechnet hat, fällt es (nach meiner Erfahrung) vielen leichter zu erkennen, dass der umgekehrte Weg eigentlich cleverer ist. LG!
wie kommt das Minus (-1,73) beim t raus? ich bekomme eine positive zahl raus. Super Videos, verstehe dadurch endlich mal die für mich mysterie der Statistik :)
Hallo Geli, im Zähler steht 2600 - 2000 - 800. Das ist auf alle Fälle negativ (-200); weil die Wurzeln im Nenner bzw. hinter dem Bruch nur positiv sein können, muss das Gesamtergebnis auch negativ sein. Verrechnet? Danke fürs Kommentieren!
Wenn man beim Zweistichproben t-Test ein niedrigeres Signifikanzniveau von 0.05 annimmt, dann muesste man die Hypothese beibehalten und nicht verwerfen (nach deiner Tabelle). Ergibt das wirklich Sinn?
asdfasdfasdfsadfsdafasdfsadfsdafasdfsadfsafsdfasdfsadfas Ja, das ist immer so: Je kleiner alpha, umso niedriger ist die Chance, die Nullhypothese zu verwerfen. Umgekehrt heißt hohes Niveau (großes alpha): Man ist nur bereit, H0 beizubehalten, wenn man einen hohen Grad an Übereinstimmung zwischen Nullhypothese und empirischen Daten findet.
Welche Tabelle benutzt du bei den Quantilen? Meine sieht irgendwie anders aus. Ich habe da kein einseitig oder zweiseitig. Also auch insgesamt. Völlig andere Werte für die T-verteilung
Man kann die Tabellen natürlich verschieden aufbauen. Ich würde aber darauf tippen, dass es schon eine Übereinstimmung (vermutlich mit meiner "einseitig"-Hälfte) gibt - die Werte müssen schon übereinstimmen. Ohne die Tabelle zu sehen, kann ich aber schlecht eine konkrete Erläuterung abgeben. LG!
Wenn ich auf Normalverteilung teste, weil ich einen Zweistichproben-Paardifferenztest durchführen möchte (bei n1 + n2 < 30), muss ich dann die Werte der der Stichproben jeweils gesondert auf Normalverteilung testen oder führe ich die gängigen Test auf Normalverteilung mit allen Stichprobenwerten aus beiden Stichproben durch (letzteres würde ja eigentlich keinen Sinn machen, v.a. wenn es tatsächlich Werte aus Gesamtheiten mit verschiedenen Mittelwerten wären)?
Hallo Kasimir, sehe genauso: Die Voraussetzung ist, dass beide Stichproben aus normalverteilten Gesamtheiten stammen; die Stichproben wären daher separat zu testen. Wenn man es genau machen möchte, sollte man zusätzlich auf gleiche Varianzen testen. LG!
Vielen Dank für die Antworten. Ist echt ein super Kanal! Wollte eigentlich für den unabhängigen Zweichstichproben t-Test fragen (und nicht für den Paardifferenztest), aber auch dort müsste ja das selbe gelten, also beide Stichprobenwerte getrennt auf Normalverteilung testen.
Oh, Entschuldigung - da habe ich nicht richtig gelesen 😓 Beim Paardifferenzentest sollte man mindestens 30 Differenzen haben und wenn nicht, sollten die Differenzen auf Normalverteilung getestet werden. LG!
Ich stehe auf dem Schlauch, ist die Paardifferenz gleichzusetzen mit dem related t-test? Das Obstbeispiel wäre ja dann nicht die selbe Stichprobe, da man gleiches Obst verwendet hat und nicht dasselbe. Wie entsteht diese Verbundenheit? Geht man davon aus, dass das Obst immer gleich fault oder ist das ein vereinfachtes Beispiel? In 05:31 min steht bei der Testverteilung ein Freiheitsgrad von 2 und du suchst später in der Tabelle bei einem Freiheitsgrad von 10. Das habe ich nicht verstanden.
Hallo Tora, die Bezeichnung "related" t-test ist ungewöhnlich, auf englisch heißt das Ganze "paired t-test" oder "dependent t-test", aber ich gehe davon aus, dass mit related t-test dasselbe gemeint ist. Es ist ein weitverbreiteter Irrglaube, dass Bindungen nur durch Messwiederholungen (also vorher/nachher Tests) entstehen. Immer, wenn es möglich ist, auf ein Element in der ersten Stichprobe zu zeigen und sofort eins aus der zweiten Stichprobe zuzuordnen, kann man von Bindungen ausgehen, die eventuell das Testergebnis beeinflussen. Beim Obst würde die Beeinflussung dadurch zustande kommen, dass Heidelbeeren viel schneller verderben als z.B. Orangen. Hätte ich hingegen eine erste Stichprobe mit 10 Orangen und eine zweite Stichprobe mit zehn Orangen, gäbe es keine Bindung (wenn ich auf eine Orange in der ersten Stichprobe zeige, gibt es keinen eindeutigen Partner in der zweiten Stichprobe). Ein vorher-nachher Test ist davon ein Spezialfall und wird deswegen auch als gepaart behandelt. Bei Minute 5:31 zeige ich die Formel: n1 - n2 - 2. Mit n1 ist der Umfang der ersten Stichprobe gemeint, mit n2 der Umfang der zweiten. Deswegen gilt im Beispiel: 6 + 6 - 2 = 10 Freiheitsgrade. LG!
Ahhh, so einfach und mein Kopf bleibt daran kleben! Vielen lieben Dank, jetzt habe ich es verstanden! oh man... Dann wird das ja doch noch was am Freitag :)
Warum muss ich beim T-Test für gepasrte Stichproben im Divisor nicht n-1 rechnen? Wird das irgendwie durch die Korrektur im geschätzen s abgedeckt? Und warum ist das dann in anderen Trsts nicht so?
Das muss ich beim Paardifferenzentest auch nicht: Bei der Berechnung der Varianzen wird durch n-1 dividiert, bei der Berechnung der t's nicht. Oder verstehe ich die Frage falsch?
Hallo Consti, nein, der Differenz-Test (so, wie ich den Namen kenne) ist für abhängige Stichproben. Wenn mit "Differenz" die Differenz zwischen den Stichprobenmittelwerten gemeint sein sollte (diesen kenne ich unter dem Namen Zweistichprobentest), dann ginge er schon. LG!
Hallo Stefan, es sind 6 + 6 = 12 Kühlschränke. Da in jeder Stichprobe die Standardabweichung aus den Stichprobenwerten berechnet werden muss, verliert man 2 Freiheitsgrade und kommt auf 12 - 2 = 10. LG!
Hallo V3noM, das ist natürlich so auf die Distanz nicht gut festzustellen. Als Fehlerquelle könnte ich mir die Auswahl des Tests (Ein-, Zweistichproben- oder Paardifferenzentest) oder die Eingabe der Varianz statt der Standardabweichung vorstellen. Hinzu kommt, dass manche online-Rechner nur Tests auf Gleichheit anbieten - man kann also nicht die hypothetische Differenz von 800,- EUR wie im Beispiel im Video angeben. Korrigieren ließe sich das, indem man als ersten Mittelwert 2600 und als zweiten Mittelwert 2800 angibt, obwohl der zweite Wert ja eigentlich 2000 beträgt (man hätte damit 2600 - 2000 - 800 = 2600 - 2800 fingiert). Viel Erfolg!
Hallo NewLysin, ganz genau - wenn man eine konkrete Vorstellung oder Vorgabe hat (wie z.B. die 10 Gramm im Video zum Einstichproben t-Test czcams.com/video/rbYg5IsOYaM/video.html, kann man auch das als Hypothese verwenden. LG!
Ich meine, wenn man z.B nach der Grösse der Menschen gesucht wird, dann arbeitet man mit echten Werten z.B untersucht man, ob die mittlere Grösse 1,70 in einem gewissen Intervall liegt. z.B (1,80, 1,90) wenn man aber mit der t-Tabelle arbeitet bekommt man immer solche Werte für das Intervall (-1.96,1-96) das ist der Sigmawert und nachher untersucht man, ob unser Wert (dieses Mal ein anders als 1.70 (unecht)) in dem Intervall liegt.
Hallo Maria, verstehe! Ich vermute, dass sich das einfach eingebürgert hat, zwingend ist es nämlich nicht: - Z.B. beim Paardifferenzentest im Video (9:22) könnte ich in der Tabelle ablesen, dass der Verwerfbereich bei einseitig rechtem Test, einem Niveau von 0,05 und 5 Freiheitsgraden bei t=2,0150 losgeht. - Sobald ich dann aus der Stichprobe s*^2 bestimmt habe, könnte ich auch die notwendige Verlängerung der durchschnittlichen Haltbarkeit berechnen, ab der man die Hypothese "Das UV-Licht bringt nichts." verwerfen muss: 2,0150 x (5,5/6)^0,5 + 0 = 1,93 Tage. Die festgestellte durchschnittliche Haltbarkeitsverlängerung 1,5 Tage ist kleiner als 1,93 Tage, also kann ich die Hypothese "bringt nichts" beibehalten. LG und viel Erfolg!
Hallo Pevi, das ist eben das, was man glaubt oder "braucht". Im Video waren es 800,- EUR (1:16), weil sich ab diesem Wert das Markendesign lohnt (das könnte man z.B. aus der Kostenrechnung wissen). Oftmals setzt man den Wert auch auf 0, wenn man keine konkrete Vorstellung hat und testen möchte, ob diese Hypothese verworfen werden muss (und man daher nicht davon ausgehen kann, dass einen keinen (=0) Unterschied gibt). LG!
Hallo Isabell, das lässt sich nicht in wenigen Worten erklären - das Video steht aber schon lange auf der Liste und ich sollte es jetzt mal in Angriff nehmen. Danke fürs Abonnieren!
Kann mir jemand erklären wieso ich beim Einstichprobentest aus der Zweiseitigen tabelle ablese und beim Zweistichprobentest aus der einseitigen? danke im voraus
Vielen dank, dass Sie sich die mühe geben Studierenden Ihre Inhalte kostenlos zur Verfügung zu stellen das hilft mir für meine Prüfung echt weiter.
Das freut mich sehr - LG und viel Erfolg!
Was Vortragende nicht einmal in 1,5 Stunden erklären können, schaffst du in 10 Minuten. Respekt & Danke!
Ich habe mich auch extra angestrengt 🙂 Vielen Dank fürs Abonnieren und Kommentieren!
Hervorragend illustrierte angewandte Statistik. Gute Beispiele und verhältnismäßig leicht erklärt.
Lieben Dank für den netten Kommentar! 🙂
Für diese Videos kommst du in den Himmel. Ganz toll aufbereitet und mit super Beispielen erklärt.
Mal schauen, wie es ausgeht. Wenn es Internet im Himmel geben sollte, melde ich mich. Wenn ich mich nicht melde, gibt's entweder kein Internet oder es hat nicht geklappt mit dem Himmel :o)
LG und danke fürs Kommentieren!
Dank Ihrer Videos ist mir in meiner Six Sigma Black Belt Zertifizierung etliches klarer und verständlicher geworden. Wirklich super. Und die wahnsinnige Mühe, die Sie sich machen. Noch nie habe ich Statistik so leicht erklärt gesehen. Übrigens finde ich die lustige Musik super - die lockert das trockene Thema absolut auf. Oft sitze ich hier und schmunzel :-) Thx to you!
Hey, das freut mich sehr, dass ich auch bei fortgeschrittenen Anwendern noch ab und zu unterstützen kann! Vielen Dank für das liebe Feedback und viel Erfolg!
omg wirklich gut erklärt mach weiter so! Habe auch noch nicht vergleichbares auf CZcams gefunden :)
Hallo Leonid, freut mich sehr ... vielen Dank auch für die Likes!
Ich studiere Geographie und habe jetzt im Modul Statistik, Dank Ihrer Videos, eine 2.0 erreicht, normalerweise waren meine Leistungen in Mathe bisher immer sehr bescheiden. Sie bringen den Stoff wirklich sehr verständlich und interessant herüber, vielen Dank für Ihre Videos ! :)
Hey, das freut mich sehr, was für ein schönes Feedback! Ich hoffe, dass die Statistikgrundlagen auch noch im Rest des Studiums nützlich sein werden (bin ich eigentlich fast sicher, spätestens, wenn es an Thesis geht) und wünsche noch viel Erfolg!
Perfekt erklärt und ganz nebenbei noch gezeigt, wie anti-Schädlings UV-Lampen funktionieren!
Auf die Lampen kam es mir eigentlich hauptsächlich an 😉 LG!
Sehr gute Videos!!! Verstehe dadurch endlich alles! Ein Video zur Faktorenanalyse sowie Clusteranalyse wäre toll :)
Danke für das Feedback und den Wunsch - ist notiert!
Ja Clusteranalyse wäre super!
Wie immer toll verständlich, wie kann man hier nur einen Daumen runter geben.....verstehe ich echt nicht
Vielen lieben Dank ... verstehe ich auch nicht 😁
Witzig, dass diese Videos genau jetzt kommen wo das 2. Semester Statistik gerade hinter mir liegt.
Die Videos werden allerdings alle als auffrisch Material genutzt, es steht ja noch Statistik 3 bevor.
Schön, dass es sich doch noch gelohnt hat diesen Kanal zu abonnieren, gute Arbeit und weiter so. :)
Ich hab' alles gegeben, um es noch vor der Klausur fertig zu bekommen und dann doch nicht geschafft O.O ... nein, Spaß, die Produktion von so einem Video ist ziemlich aufwendig und ich muss es halt dahin packen, wo es zeitlich passt. Immerhin hatte ich ja vorher auch schon ein paar Videos am Start ;o) ... Statistik DREI??? Ihr werdet ja ganz schön rangenommen. Richtig so. :D ... danke fürs Abonnieren und Kommentieren jedenfalls und LG!
Hey, vielen Dank für deine Videos! Ich habe eine Frage zur Nullhypothese: Geht diese nicht normalerweise davon aus, dass die Mittelwertsunterschiede zufällig sind, also der Unterschied im Umsatz der verschiedenen Automaten nicht auf die Vorteile des Designerautomaten zurückzuführen sind und er sich darum nicht lohnt? Ich hätte vermutet, dass die H0 (bei einseitiger Testung) wie folg lautet: Mittwelwert_Design - Mittelwert_Normal = 0 und stattdessen die H1 lautet Mittelwert_D - Mittelwert_Normal >= 800. Oder trifft das nur auf Einstichproben zu?
wow, danke für diese tolle Video-Serie, ich habs verstanden! :) Sie haben wirklich ein Talent, Sachverhalte eindeutig zu erklären!
Ich sitze gerade an meiner Bachelorarbeit zum Thema "automatisierte kontenbasierte Klassifikation von Konto-Umsätzen" und hab dazu eine Frage bezüglich des Paardifferenzentests.
Ich habe ein Konto mit N klassifizierten Umsätzen. Ich lerne damit verschiedene Modelle (Entscheidungsbaum, naiven Bayes, Neuronale Netze) an und möchte die Fehlerrate der Klassifizierer vergleichen. Da würde sich ja zunächst mal der Paardifferenzentest anbieten um die Fehlerraten zu vergleichen bzw. zu entscheiden ob die Fehlerrate eines Klassifizierer "höher" ist als die des anderen.
Allerdings sind die N Umsätze nicht nur eine Stichprobe (also eine Teilmenge), sondern tatsächlich ALLE Umsätze, die es auf diesem Konto gibt, also die Grundgesamtheit. Ergibt nun der Paardifferenzentest in diesem Szenario trotzdem noch Sinn oder kann ich im Falle, dass die Fehlerraten zweier Grundgesamtheiten vorliegen, "einfach so" die Zahlen miteinander vergleichen, ohne den Test?
Die Klassifikation bezieht sich tatsächlich auch nur auf dieses Konto und nicht auf potentiell andere Konten.
Über eine Antwort wäre ich Ihnen sehr dankbar. Keep doing it!
Hallo Matthias, vielen Dank für das liebe Feedback! Die Frage, die sie haben, hat viele Facetten und lässt sich deswegen nicht in Kürze abschließend beantworten. Ich will aber versuchen, ein paar Denkanregungen zu geben.
1. Sie sprechen eine wesentliche Grundsatzfrage an: Statistische Tests sind dazu da, um Aussagen zu Grundgesamtheiten zu testen, wenn man nur auf eine Stichprobe zurückgreifen kann. Kennt man die ganze Grundgesamtheit (und kann man sie auch auswerten), braucht man eigentlich keinen Test. Die Frage ist aber: Kenn Sie wirklich die ganze Grundgesamtheit? Wird es also zum Beispiel in der Zukunft keine weiteren Umsätze mehr geben, die Sie heute noch nicht kennen (und die Sie eventuell mit Ihrem Modell vorhersagen möchten)?
2. Selbst wenn die Antwort auf die erste Frage "ja" ist, möchten Sie sicher trotzdem noch die Zuverlässigkeit der Modelle gegeneinander vergleichen:
- Ein übliches Verfahren wäre hier z.B. eine Confusion Matrix (auf deutsch: Wahrheitsmatrix: de.wikipedia.org/wiki/Beurteilung_eines_bin%C3%A4ren_Klassifikators#Wahrheitsmatrix:_Richtige_und_falsche_Klassifikationen), mit welchem einfach die Zahl der richtigen und falschen Klassifikationen verglichen wird.
- Da Sie Umsätze (also ein quasi-stetiges Merkmal) klassifizieren möchten, wäre vielleicht eine ROC-Kurve sinnvoll (de.wikipedia.org/wiki/Receiver_Operating_Characteristic).
3. Bei Modellen ist es üblich, einzelne Parameter auf Verschiedenheit von 0 zu testen (ist ein Parameter nicht signifikant verschieden von 0, kann er aus dem Modell entfernt werden). Als Rechtfertigung für derartige Tests könnte man bei Ihnen anführen, dass jeder Umsatz in Ihrem Datensatz ja auch leicht anders hätte ausfallen können, also selbst nur die Realisation einer Zufallsvariablen ist. Mit derselben Begründung können Sie eventuell auch den Test der Fehlergrößen gegeneinander verwenden: Wenn die Umsätze (und die Vorhersagevariablen) als Zufallsgrößen gedeutet werden können, dann wären auch die Parameter der resultierenden Modelle zumindest zum Teil Ergebnis eines Zufallsexperiments, und damit auch die Modellvorhersagen. Damit würde gelten: Nur, wenn die Modellvorhersagen eines Modells signifikant besser als die eines anderen Modells sind, sollte man es dem anderen Modell vorziehen ... insbesondere dieser letzte Punkt ist bitte als Denkanstoß zu verstehen; man müsste nochmal im Detail überlegen, ob das so passt.
Ich hoffe, trotzdem geholfen zu haben ... viele Grüße und viel Erfolg!
Vielen Dank für die ausführliche Antwort! Das hat sehr weitergeholfen. Alles Gute Ihnen!
Genial danke dir ein Abonnent mehr🌀⚜️
Danke fürs Abonnieren ... und Kommentieren natürlich! :o)
Tolles Video, weiter so :)
Danke und LG!
Geil ! einfach nur Geil
Danke 🙂
super video
Vielen Dank für das verständliche Video. Im Paardifferenzentest sagst Du allerdings, dass es üblich sei die Nullhypothese so zu formulieren, dass es "keinen Unterschied gäbe" also in dem Beispiel µ = 0. Im Zweistichprobentest haben wir die Nullhypothese allerdings so formuliert, dass die Maßnahme den Designerkühlschrank zu nutzen einen Effekt hätte (µ >= 800). Für mich sind das widersprüchliche Aussagen. Verstehe ich etwas falsch?
Mit "üblich" meine ich, dass man das sehr oft (man könnte fast sagen, standardmäßig) so macht, weil man meistens keine konkrete Ansicht zum Unterschied hat und deswegen testet, ob man die Hypothese "Es gibt keinen Unterschied." (also µ = 0) beibehalten kann oder verwerfen muss. Das heißt aber nicht, dass man das immer so machen muss. Wenn man eine konkrete Annahme hat (oder eine Forderung, wie z.B. 800,- EUR im Video), kann man auch das als Nullhypothese wählen. LG!
μDesign, haha ich schmeiß mich weg :D
ich bin verdammt nochmal gestorben, als er das rausgehauen hat. Das muss er doch vorher schon gewusst haben! xD
Wegen müdesein?
mega gut! DANKE!!!
Vielen Dank und sehr gerne! 🙂
Könntest Du ein Video zum Maximum-Likelihood-Schätzer und dessen Herleitung machen?
Super gute Videos übrigens! Einsame Spitze auf dem Gebiet hier auf CZcams!
Vielen lieben Dank, auch für den Videowunsch - werde ich mir merken! LG!
Wie erkenne ich denn nun, was eine abhängige und eine unabhängige Stichprobe ist?
ansonsten ein super video - gut verständlich
Hallo Nadine, am besten suchen Sie sich einen beliebigen Merkmalsträger aus der ersten Stichprobe. Wenn Sie zu diesem einen (ziemlich offenischtlichen) Partner in der zweiten Stichprobe finden können, handelt es sich vermutlich um abhängige Stichproben.
warum ist das hier ein linksseitiger test?
und lautet die h1 nicht mü(design)-mü(normal)=grössergleich 800? ich dachte, das was man testen möchte ist immer h1?
vielen lieben dank für deine tollen videos und all die mühe die dahinter steckt!!!
Liebe Valentina, das habe ich mich auch schon gefragt mit der Hypothese ..finde aber trotzdem die Videos super !
Ist auf jeden Fall Unsinn. Die Alternativhypothese H1 meint normalerweise die Vermutung, die Nullhypothese die Ausgangssituation, dass etwas keinen Einfluss hat oder gleich ist.
In die H1 fliesst doch das forschungsinteresse oder?
Vielen Dank für das Video. Bei mir sieht die Formel im Buch irgendwie anders aus: (Durchschnitt von x1-Durchschnitt von x2) /Bruch Standardfehler. Kann man das so auch machen für den zwei Stichprobentest zweiseitig ?
Müsste ich sehen. So beschrieben klingt die Formel recht kurz. Fakt ist aber, dass man die Formel auf alle möglichen Arten umstellen kann und in den verschiedensten Formen in Formelsammlungen findet.
Vielen Dank für deine Videos! Die helfen echt super gut weiter! Kommen denn mal wieder neue? Ich würde mir nämlich das Thema Pearsonscher Korrelationskoeffizient und Spearmanscher Rangkorrelationskoeffizient wünschen. Liebe Grüße
Zum metrischen Korrelationskoeffizienten habe ich schon ein Video gemacht: czcams.com/video/IwJ7RPIAxUo/video.html
Der Wunsch zur Rangkorrelation ist notiert!
Sehr gut aufgebautes Video gut zu verstehen! Habe aber eine Frage zum Obst Beispiel. Wenn Max jetzt wie im Beispiel aber mehrere Kisten einer Gruppe z.B. Orangen mit und ohne UV-Licht untersuchen wollte, müsste er dann für jede Gruppe also Bananen; Orangen... den Zweistichproben test anwenden oder könnte er den Paardifferenzentest mit den Mittelwerten anwenden?
Hallo Daniel, danke für das Feedback! Es kommt immer darauf an, wie man das Experiment aufbaut.
1. Man könnte z.B. fragen, ob das Licht bei Bananen hilft und dann mehrere Bananen mit und mehrere ohne Licht lagern.
1a) Wenn man dann keine Paare bilden kann (ich kann nicht eine Banane der ersten Menge nehmen und sofort sagen, welche Banane der zweiten Menge dazu gehört), würde man den Zweistichproben t-Test nehmen.
1b) Wenn ich es doch kann (z.B. aufgrund der Größe, ob sie oben/unten/in der Mitte lag, ihres Herkunftslandes etc.), wäre es wieder der Paardifferenzentest.
Daran sieht man auch, dass man eventuell ein Kriterium der Zusammengehörigkeit übersehen könnte - man muss einfach sorgfältig über die Situation nachdenken; ein komplett formales Kriterium kann es nicht geben.
2. Wenn man das Experiment so aufbaut, wie ich Ihren Vorschlag verstehe (eine Kiste Bananen mit/eine ohne, eine Kiste Orangen mit/eine ohne usw.), für jede Kiste einen Mittelwert feststellt, und dann die Mittelwerte der Mittelwerte gegeneinander testet, hätte man trotzdem verbundene Stichproben (also Paardifferenzentest), weil ich ja wieder Mittelwertpaare bilden kann (ich weiß übrigens nicht aus dem Stegreif, ob Mittelwerte aus Mittelwerten noch t-verteilt sind, glaube aber schon).
Ein wesentlicher Punkt, den man aus den Überlegungen mitnehmen kann, ist: Man sollte sich unbedingt bei der Entwicklung des Experiments überlegen, wie man es eigentlich auswerten will und den Versuchsaufbau so wählen, dass die Sachlage möglichst eindeutig ist.
LG!
Gern geschehen.
Danke für die Antwort. Ja genau wie in 2. hatte ich das gemeint. Ich schreibe gerade an meiner Bachelor Thesis und habe genau das Problem zu sagen ob es einen signifikanten Unterschied gibt oder nicht. Vielen Dank noch mal.
Freue mich schon auf Ihr nächstes Video
Vielen Dank für die Videos! Eine kurze Frage habe ich: Kann es sein, dass in R das von Ihnen benannte Testniveau (z.B. = 0.1 oder 0.05) dem conf.intervall (z.B. gleich 0.9 oder 0.95) entspricht?
Hallo Dominik, im Prinzip haben die beiden Sachen ziemlich viel miteinander zu tun, aber von Konfidenzintervallen spricht man eher beim Schätzen: czcams.com/video/DdwTa28W4Os/video.html LG und viel Erfolg!
0 Daumen runter :). Das sagt sehr viel aus und dem kann ich mich nur anschließen. Danke !
Hallo Andy, vielen Dank ... ich glaube, bis zu dem Video schaffen es nur Leute, die es auch wirklich ernst meinen. Die anderen Videos, die man ansehen "muss" haben schon ein paar Dislikes :D ... LG und viel Erfolg!
Hallo, ich habe zwei Fragen:
1. Wie gehe ich mit extrem ungleichen Stichprobengrößen (Messwiederholung = abhängige Gruppen, 2 Zeitpunkte) um?
Zum ersten Zeitpunkt habe ich ca. drei mal so viele Daten wie beim zweiten, also ein erhebliches Drop-out.
2. Wie beschreibt man bei einer Bachelorarbeit im Rahmen der Methoden/Datenanalyse den Umgang mit Demografiedaten? Einfach "Es werden deskriptive Statistiken berechnet"? Meine Betreuerin hat angemerkt ich solle noch hinzufügen wie wir "Demodaten analysieren" - Ich glaube damit sind demografische Daten gemeint, will aber auch nicht wegen jeder Kleinigkeit nachfragen. Oder könnte eher sowas gemeint sein, dass man bspw. den Einfluss von Alter, ... testen möchte z.B. durch eine Multiple Regression?... Ich stehe etwas auf dem Schlauch, hoffe ich hab es verständlich beschrieben. Lieben Dank schon mal :)
Hallo Chino, zunächst sind Unterschiede im Stichprobenumfang nicht unbedingt ein Problem, eine hohe drop-out Quote ist allerdings schon eins. Es gibt hier drei Möglichkeiten:
1.) Man kann begründen, dass die die drop-outs unproblematisch weil zufällig sind. Dann kann man oft mit der kleineren Stichprobe normal weiterarbeiten.
2.) Leider stehen drop-out und das, was man untersuchen möchte, häufig im Zusammenhang. Man kann dann versuchen, die Verhältnisse im drop-out Anteil abzuschätzen, indem man die Personen doch noch irgendwie zu einer Aussage bringt, oder indem man auf ähnliche Untersuchungen oder Expertenmeinungen zurückgreift.
3.) Im schlimmsten Fall kann man Extremannahmen treffen und Ergebnisse berechnen einmal unter der Annahme, dass alle drop-outs eine besonders positive Entwicklung zeigen würden und einmal unter der Annahme, dass sie eine besonders negative Entwicklung durchgemacht haben. Ich fürchte aber, dass man bei einer derart hohen drop-out Quote dabei erkennen wird, dass der Datensatz wertlos geworden ist.
Bei der Beschreibung der Demografiedaten ist vermutlich gemeint, wie Sie diese erhoben haben und auf welche Art sie analysiert wurden.
LG und danke für das Like!
Es handelt sich bei mir um die gleiche Untersuchung, beim 1. Zeitpunkt sind die Fragen retrospektiv gestellt, beim 2. Zeitpunkt beziehen sie sich auf den aktuellen Zeitpunkt. Ich denke das drop-out hängt mit der Länge des Fragebogens zusammen (ca. 1h). Also werfe ich quasi diejenigen raus, von denen ich nur einen Zeitpunkt habe und rechne dann mit dem verkleinerten n weiter?
Wie kommt man auf solche Aufgaben :D aber super Video!
Ich habe mir extraviel Mühe gegeben 😊 Danke fürs Kommentieren!
Hallo Matthias vielen dank für die super Videos, warum wird bei der Hypothese das große mü verwendet wenn wir doch nie die Grundgesamtheit kennen und nur mit dem mittelwert der Stichprobe arbeiten?
Wann muss ich wissen wann ich das Gegenteil der null Hypothese formuliere? Weil bisher haben wir die null hypothese so formuliert wie auch der test war?
Und woher soll ich wissen das z.b. dieser Fruchttest verbunden ist? Das könnten doch die smoothies auch sein oder nicht? Warum sind diese unabhängig?
Hallo Julia nochmal! Also, das ist ein kleines mü, und das ist der Ansatz beim Testen: Natürlich wissen wir nicht, was der Mittelwert ist, aber wir sagen "Ich stelle die Hypothese auf, dass der Mittelwert 10 beträgt." Danach zieht man eine Stichprobe und stellt fest, ob die Stichprobe zur Hypothese passt. Wenn das vorstellbar ist, behält man die Hypothese bei. Weicht die Stichprobe stark von der Hypothese ab, wird sie verworfen (man hört dann also auf zu behaupten, dass der Mittelwert 10 ist).
Zu verbundenen Tests: Das ist das, was ich ab Minute 8:00 erkläre. Natürlich könnten auch die Smoothies zu einer Verbindung führen (z.B. wenn ich Paare gleichen Geschmacks oder Paare gleichen Produktionsdatums habe). Wenn Max den Test mit den Kühlregalen so gemacht hätte, dass er 6 Geschäfte auswählt und dann in jedem Geschäft eine Woche im normalen und eine Woche im Designregal verkauft, hätte er hier auch verbundene Stichproben gehabt, weil über die Geschäfte Paarungen entstehen.
Ich meine die Hypothese lautet mit dem kleinen mü aber verwendet wird dann x quer bei der Berechnung?
Also ich würde die H0 als H1 aufstellen.. Die H0 geht ja immer davon aus, dass es "keinen Effekt" gibt. Hab ich da was falsch verstanden? Hilfe Mathias!
Hallo Alexis, manchmal liest man, dass H0 _immer_ als "kein Unterschied" formuliert wird. Das stimmt aber nicht - wenn ich prüfen möchte, ob der Unterschied (mindestens) einem bestimmten Wert entspricht, kann ich selbstverständlich auch diesen Wert als H0 formulieren.
Wesentlich ist aber: H0 muss ein _konkreter_ Wert sein, weil man sonst keine Testverteilung ableiten kann. Weil man oft glaubt, dass es einen Unterschied gibt, ohne jedoch einen konkreten Wert angeben zu wollen/können, wählt man als H0 "Der Unterschied ist 0.", weil 0 ein konkreter Wert ist. Danach prüft man, ob sich diese Behauptung beibehalten lässt oder nicht (und schlussfolgert im letzteren Fall: es muss einen Unterschied geben).
LG und danke fürs Liken und Abonnieren!
Tolles Video, wie immer. Nur gibt es ein kleinen Fehler bei der Formel des Paardifferenztests. Dort heißt es die Wurzel aus 5,5:6. Das stimmt aber nicht, die Wurzel wird nur aus der 6 gezogen, somit wäre die richtige Formel: 5,5/ Wurzel aus 6 = 2,245
Hallo Misshoney, nein, die Formel stimmt schon:
- Man zieht nur dann die Wurzel lediglich aus n (hier also 6), wenn im Zähler die Standardabweichung s* steht.
- s* ist die Wurzel aus der Varianz s*^2.
- Benutzt man wie ich die Varianz s*^2, muss die Wurzel daher über den gesamten Bruch gehen.
LG, viel Erfolg und danke fürs Liken!!!
Kurzes Tutorium Statistik ok, verstehe. Aber das Ergebnis sollte doch dann gleich sein, warum bekomme ich dann ein anderes Ergebnis. T ist bei mir dann 1,5/2,25= 0,66
@@Misshoney20 Vielleicht sind die Klammern falsch gesetzt?
@@pdmb ich hab leider ein gravierenden Fehler gemacht, my fault sorry. Danke, für die schnelle Rückmeldung.
Hallo Herr Bärtl,
wäre es in dem Beispiel mit dem Regal nicht besser, die Nullhypothese so zu formulieren, dass wir sagen „... ist kleiner gleich 800“? Sodass wir in der Alternativhypothese zeigen können dass die Differenz bestenfalls größer als 800 ist? Ich kann dann ja mit einer Irrtumswkt. von 10% testen, ob sich das modifizierte Design (was vermutlich auch teurer ist) wirklich lohnt.
Können Sie vielleicht kurz erklären, warum Sie die Nullhypothese so formuliert haben ?
Hallo Sabrina, für eine echte Untersuchung mit dieser Fragestellung hätte ich H0 so formuliert, wie Sie es vorschlagen. Ich vermute aber, dass die im Video gewählte Formulierung für Zuschauer, die mit dem Testen noch nicht so vertraut sind, einfacher nachzuvollziehen ist: Ich glaube (hoffe), dass der Umsatz um mindestens 800 Euro höher ist, also formuliere ich die Hypothese dementsprechend.
Wenn man dann auf diesem Weg ein Beispiel durchgerechnet hat, fällt es (nach meiner Erfahrung) vielen leichter zu erkennen, dass der umgekehrte Weg eigentlich cleverer ist. LG!
Kurzes Tutorium Statistik Danke für die schnelle und hilfreiche Antwort! Ihre Videos sind übrigens die besten :)
wie kommt das Minus (-1,73) beim t raus? ich bekomme eine positive zahl raus. Super Videos, verstehe dadurch endlich mal die für mich mysterie der Statistik :)
Hallo Geli, im Zähler steht 2600 - 2000 - 800. Das ist auf alle Fälle negativ (-200); weil die Wurzeln im Nenner bzw. hinter dem Bruch nur positiv sein können, muss das Gesamtergebnis auch negativ sein. Verrechnet? Danke fürs Kommentieren!
ah, ok vielen Dank für die Antwort :)
Was habe ich gelernt:
,,ich sollte kein Obst essen!"
... oder eine andere Beleuchtung wählen ;o)
Wenn man beim Zweistichproben t-Test ein niedrigeres Signifikanzniveau von 0.05 annimmt, dann muesste man die Hypothese beibehalten und nicht verwerfen (nach deiner Tabelle). Ergibt das wirklich Sinn?
asdfasdfasdfsadfsdafasdfsadfsdafasdfsadfsafsdfasdfsadfas Ja, das ist immer so: Je kleiner alpha, umso niedriger ist die Chance, die Nullhypothese zu verwerfen. Umgekehrt heißt hohes Niveau (großes alpha): Man ist nur bereit, H0 beizubehalten, wenn man einen hohen Grad an Übereinstimmung zwischen Nullhypothese und empirischen Daten findet.
Welche Tabelle benutzt du bei den Quantilen? Meine sieht irgendwie anders aus. Ich habe da kein einseitig oder zweiseitig. Also auch insgesamt. Völlig andere Werte für die T-verteilung
Man kann die Tabellen natürlich verschieden aufbauen. Ich würde aber darauf tippen, dass es schon eine Übereinstimmung (vermutlich mit meiner "einseitig"-Hälfte) gibt - die Werte müssen schon übereinstimmen. Ohne die Tabelle zu sehen, kann ich aber schlecht eine konkrete Erläuterung abgeben. LG!
Wenn ich auf Normalverteilung teste, weil ich einen Zweistichproben-Paardifferenztest durchführen möchte (bei n1 + n2 < 30), muss ich dann die Werte der der Stichproben jeweils gesondert auf Normalverteilung testen oder führe ich die gängigen Test auf Normalverteilung mit allen Stichprobenwerten aus beiden Stichproben durch (letzteres würde ja eigentlich keinen Sinn machen, v.a. wenn es tatsächlich Werte aus Gesamtheiten mit verschiedenen Mittelwerten wären)?
Hallo Kasimir, sehe genauso: Die Voraussetzung ist, dass beide Stichproben aus normalverteilten Gesamtheiten stammen; die Stichproben wären daher separat zu testen. Wenn man es genau machen möchte, sollte man zusätzlich auf gleiche Varianzen testen. LG!
Vielen Dank für die Antworten. Ist echt ein super Kanal!
Wollte eigentlich für den unabhängigen Zweichstichproben t-Test fragen (und nicht für den Paardifferenztest), aber auch dort müsste ja das selbe gelten, also beide Stichprobenwerte getrennt auf Normalverteilung testen.
Oh, Entschuldigung - da habe ich nicht richtig gelesen 😓 Beim Paardifferenzentest sollte man mindestens 30 Differenzen haben und wenn nicht, sollten die Differenzen auf Normalverteilung getestet werden. LG!
Alles klar, so macht das für mich auch Sinn. Vielen Dank fürs Antworten!!!
Ich stehe auf dem Schlauch, ist die Paardifferenz gleichzusetzen mit dem related t-test? Das Obstbeispiel wäre ja dann nicht die selbe Stichprobe, da man gleiches Obst verwendet hat und nicht dasselbe. Wie entsteht diese Verbundenheit? Geht man davon aus, dass das Obst immer gleich fault oder ist das ein vereinfachtes Beispiel?
In 05:31 min steht bei der Testverteilung ein Freiheitsgrad von 2 und du suchst später in der Tabelle bei einem Freiheitsgrad von 10. Das habe ich nicht verstanden.
Hallo Tora, die Bezeichnung "related" t-test ist ungewöhnlich, auf englisch heißt das Ganze "paired t-test" oder "dependent t-test", aber ich gehe davon aus, dass mit related t-test dasselbe gemeint ist.
Es ist ein weitverbreiteter Irrglaube, dass Bindungen nur durch Messwiederholungen (also vorher/nachher Tests) entstehen. Immer, wenn es möglich ist, auf ein Element in der ersten Stichprobe zu zeigen und sofort eins aus der zweiten Stichprobe zuzuordnen, kann man von Bindungen ausgehen, die eventuell das Testergebnis beeinflussen. Beim Obst würde die Beeinflussung dadurch zustande kommen, dass Heidelbeeren viel schneller verderben als z.B. Orangen. Hätte ich hingegen eine erste Stichprobe mit 10 Orangen und eine zweite Stichprobe mit zehn Orangen, gäbe es keine Bindung (wenn ich auf eine Orange in der ersten Stichprobe zeige, gibt es keinen eindeutigen Partner in der zweiten Stichprobe). Ein vorher-nachher Test ist davon ein Spezialfall und wird deswegen auch als gepaart behandelt.
Bei Minute 5:31 zeige ich die Formel: n1 - n2 - 2. Mit n1 ist der Umfang der ersten Stichprobe gemeint, mit n2 der Umfang der zweiten. Deswegen gilt im Beispiel: 6 + 6 - 2 = 10 Freiheitsgrade.
LG!
Ahhh, so einfach und mein Kopf bleibt daran kleben! Vielen lieben Dank, jetzt habe ich es verstanden! oh man...
Dann wird das ja doch noch was am Freitag :)
Warum muss ich beim T-Test für gepasrte Stichproben im Divisor nicht n-1 rechnen? Wird das irgendwie durch die Korrektur im geschätzen s abgedeckt? Und warum ist das dann in anderen Trsts nicht so?
Das muss ich beim Paardifferenzentest auch nicht: Bei der Berechnung der Varianzen wird durch n-1 dividiert, bei der Berechnung der t's nicht. Oder verstehe ich die Frage falsch?
Kurzes Tutorium Statistik oh ok danke, das war genau was ich meinte 😋
kann ich den asymptotischen Differenz-Test auch bei unabhängigen Stichproben verwenden ?
Hallo Consti, nein, der Differenz-Test (so, wie ich den Namen kenne) ist für abhängige Stichproben. Wenn mit "Differenz" die Differenz zwischen den Stichprobenmittelwerten gemeint sein sollte (diesen kenne ich unter dem Namen Zweistichprobentest), dann ginge er schon. LG!
Hab grad nen paardifferenztest durchgeführt...mein t ist deutlich negativ...wie interpretier ich das? Danke :)
Matti wissen sie was ich mache ? Ich küss ihr Auge!
Gruß Statistik Rob
😄
Warum werden den 10 Freiheisgrade bei 6 Kühlschränken gewählt?
Hallo Stefan, es sind 6 + 6 = 12 Kühlschränke. Da in jeder Stichprobe die Standardabweichung aus den Stichprobenwerten berechnet werden muss, verliert man 2 Freiheitsgrade und kommt auf 12 - 2 = 10. LG!
Wie kommt es dass mein Rechenergebnis bei exakter Befolgung des Videos absolut nicht mit dem aus den t-test Rechnern im Internet zusammen passt?
Hallo V3noM, das ist natürlich so auf die Distanz nicht gut festzustellen. Als Fehlerquelle könnte ich mir die Auswahl des Tests (Ein-, Zweistichproben- oder Paardifferenzentest) oder die Eingabe der Varianz statt der Standardabweichung vorstellen. Hinzu kommt, dass manche online-Rechner nur Tests auf Gleichheit anbieten - man kann also nicht die hypothetische Differenz von 800,- EUR wie im Beispiel im Video angeben. Korrigieren ließe sich das, indem man als ersten Mittelwert 2600 und als zweiten Mittelwert 2800 angibt, obwohl der zweite Wert ja eigentlich 2000 beträgt (man hätte damit 2600 - 2000 - 800 = 2600 - 2800 fingiert). Viel Erfolg!
Man könnte auch sagen man glaubt etwas dran und nimmt nicht 0 sondern 1Tag? Oder 2 Tage? Das kann man doch auslegen wie mal will oder wie?
Hallo NewLysin, ganz genau - wenn man eine konkrete Vorstellung oder Vorgabe hat (wie z.B. die 10 Gramm im Video zum Einstichproben t-Test czcams.com/video/rbYg5IsOYaM/video.html, kann man auch das als Hypothese verwenden. LG!
Wieso teilt man bei der Differenz durch 5 und nicht durch 6? :) das ist mir noch nicht ganz klar geworden.
Hallo Hanna, das erkläre ich in meinem Vorlesungsvideo zum Schätzen ab Minute 9:33 czcams.com/video/pQguWV3pse0/video.html LG!
warum wenn wir den t test verwenden, arbeiten wir nie mit den echten Werten, wobei bei dem Z Test, das immer der Fall ist?
Hallo Maria, ich bin nicht ganz sicher, ob ich die Frage richtig verstehe. Was ist mit "echten" Werten gemeint? LG!
Ich meine, wenn man z.B nach der Grösse der Menschen gesucht wird, dann arbeitet man mit echten Werten z.B untersucht man, ob die mittlere Grösse 1,70 in einem gewissen Intervall liegt. z.B (1,80, 1,90) wenn man aber mit der t-Tabelle arbeitet bekommt man immer solche Werte für das Intervall (-1.96,1-96) das ist der Sigmawert und nachher untersucht man, ob unser Wert (dieses Mal ein anders als 1.70 (unecht)) in dem Intervall liegt.
Hallo Maria, verstehe! Ich vermute, dass sich das einfach eingebürgert hat, zwingend ist es nämlich nicht:
- Z.B. beim Paardifferenzentest im Video (9:22) könnte ich in der Tabelle ablesen, dass der Verwerfbereich bei einseitig rechtem Test, einem Niveau von 0,05 und 5 Freiheitsgraden bei t=2,0150 losgeht.
- Sobald ich dann aus der Stichprobe s*^2 bestimmt habe, könnte ich auch die notwendige Verlängerung der durchschnittlichen Haltbarkeit berechnen, ab der man die Hypothese "Das UV-Licht bringt nichts." verwerfen muss: 2,0150 x (5,5/6)^0,5 + 0 = 1,93 Tage.
Die festgestellte durchschnittliche Haltbarkeitsverlängerung 1,5 Tage ist kleiner als 1,93 Tage, also kann ich die Hypothese "bringt nichts" beibehalten.
LG und viel Erfolg!
wie kommt man auf den mittelwert der hypothere?
Hallo Pevi, das ist eben das, was man glaubt oder "braucht". Im Video waren es 800,- EUR (1:16), weil sich ab diesem Wert das Markendesign lohnt (das könnte man z.B. aus der Kostenrechnung wissen). Oftmals setzt man den Wert auch auf 0, wenn man keine konkrete Vorstellung hat und testen möchte, ob diese Hypothese verworfen werden muss (und man daher nicht davon ausgehen kann, dass einen keinen (=0) Unterschied gibt). LG!
Bei mir streuen sich Metastasen von diesem Fach
Freut mich, dass ich helfen konnte 🙂
@@pdmb Sicher lustig einem todkranken sowas zu schreiben
Videos sind gut! Bitte in Zukunft aber ohne Hintergrundmusik. Die ist mega nervig.
Danke!
Wie legt man das Testniveau fest?
Hallo Isabell, das lässt sich nicht in wenigen Worten erklären - das Video steht aber schon lange auf der Liste und ich sollte es jetzt mal in Angriff nehmen. Danke fürs Abonnieren!
Kurzes Tutorium Statistik Danke für die Antwort! Wäre super, wenn es so eins gibt. Ich finde die Videos unglaublich hilfreich. :)
Kann mir jemand erklären wieso ich beim Einstichprobentest aus der Zweiseitigen tabelle ablese und beim Zweistichprobentest aus der einseitigen?
danke im voraus