Teste de hipóteses e valor-p: Teoria e simulação com Python

Sdílet
Vložit
  • čas přidán 7. 09. 2024
  • Nessa aula apresentamos os conceitos básicos de testes de hipóteses para a média e proporção. Os conceitos são apresentados através de exemplos e simulações em Python.
    Códigos em Python:
    github.com/fra...
    Leitura complementar: www.probabilit...
    Playlists:
    Probabilidades: www.youtube.co....
    Estatística Básica: www.youtube.co....
    Ciência de Dados: www.youtube.co....
    Processos Estocásticos: www.youtube.co....
    Canal no Telegram: t.me/cdcomplexos​
    Medium: / francisco-rodrigues
    Música: www.bensound.com

Komentáře • 22

  • @FranciscoRodrigues
    @FranciscoRodrigues  Před 2 lety +8

    Observação importante: quando afirmamos que aceitamos H0, não dizemos que H0 é verdadeira, mas que há evidência para aceitar essa hipótese com um dado nível de significância. Notem que o teste é feito baseando-se apenas na amostra coletada. Se coletarmos outra amostra, talvez o resultado do teste mude. Esta interpretação é importante, pois está ligada a muitos erros em resultados de experimentos científicos. Na verdade, o filósofo Karl Popper analisou essa ideia com o exemplo dos cisnes. Se observamos cisnes brancos ao longo de muitos anos, nunca podemos dizer com certeza que todos os cisnes são brancos. Não podemos generalizar conclusões baseando-se em nossas observações. Assim, se a hipótese nula é “todos os cisnes são brancos”, nunca podemos aceita-la como verdade. Portanto, podemos dizer que ao aceitar H0, falhamos em rejeitar a hipótese nula. Quando dizemos no vídeo “aceitamos H0”, não estamos dizendo que essa hipótese é verdadeira, mas que não há evidências suficientes para rejeitá-la. Quem preferir, pode trocar aceitamos H0 por “falhamos em rejeitar H0”. É uma questão de interpretação. No entanto, decidimos seguir a nomenclatura usada na maioria dos livros de estatística. Uma outra maneira mais precisa é dizer que "deixamos de rejeitar H0", ao invés de dizermos que "aceitamos H0". No entanto, o mais importante é ter em mente que nunca podemos dizer que H0 é verdadeira.

  • @rborges111
    @rborges111 Před 4 lety +4

    Excelente vídeo... em poucos minutos uma quantidade enorme de conceitos bem explicados de maneira super didática. Obrigado professror!!!

  • @jorgelutif1597
    @jorgelutif1597 Před 3 lety +2

    Parabéns pelo material e pelas aulas ... Está me ajudando muito ... Revisar aplicações de Estatística no formato EAD em vritude da pandemia está sendo um gigantesco desafio ... Está de Parabéns pelas aulas ...

  • @thaistakeuchi6189
    @thaistakeuchi6189 Před 2 lety

    Professor, tudo bem?
    Agradeço enormemente a atenção, didática e cuidado que o senhor tem em explicar conceitos abstratos de uma forma tão tangível. Há alguns anos tento entender p-valor e neste vídeo tive a oportunidade de clarear minha mente com sua explicação. Assistir seus vídeos são refrescantes pra mente! Muito obrigada!☺

  • @araujopsy
    @araujopsy Před 3 lety +2

    Estas classes são muito boas.

  • @flesker7693
    @flesker7693 Před rokem

    Que aula meus amigos!

  • @Edgardpfn
    @Edgardpfn Před 4 lety +2

    Excelente, Professor!

  • @donizetenunes748
    @donizetenunes748 Před 2 lety

    Excelente aula

  • @maxwellvaz5852
    @maxwellvaz5852 Před 3 lety

    top

  • @Fehh99
    @Fehh99 Před rokem

    Excelente aula Professor Francisco! Só fiquei com uma questão, quando fazemos uma reamostragem com bootstrap, agora passamos a conhecer o desvio padrão da nossa amostra, então para analisar a amostra podemos utilizar a distribuição normal com o desvio padrão, certo? Minuto do vídeo que gerou a dúvida (33:47). Tem algum video que explica algum exemplo utilizando bootstrap?

  • @IdeiaDeJirico
    @IdeiaDeJirico Před 3 lety

    Olá professor, tudo bem? Fiquei com uma dúvida no exercício do fabricante de cigarros. Com nível de significância de 5%, eu não deveria ter 2,5% em cada lado da distribuição?
    Um grande abraço, e parabéns pelo trabalho. Com certeza um dos melhores canais de ciência de dados do CZcams.

    • @FranciscoRodrigues
      @FranciscoRodrigues  Před 3 lety +4

      Obrigado Bruno! Sobre sua dúvida, pode ser feito assim também, mas aí muda o teste. Como consideramos apenas Ha: mu > 20, entao temos que p(Z > z) = 0,05. Se considerássemos diferentes de 20, aí seria 2,5%, pois consideraríamos os dois lados da distribuição. Em resumo, você deve observar se Ha seria >, < ou diferente de mu. Se for diferente, tem que considerar os dois lados da distribuição (alpha/2 em cada lado). Se for > ou

    • @IdeiaDeJirico
      @IdeiaDeJirico Před 3 lety +1

      @@FranciscoRodrigues entendido professor, muito obrigado pelo esclarecimento! E mais uma vez parabéns pelo trabalho!

  • @Gaga-vb3qv
    @Gaga-vb3qv Před 3 lety

    Bom dia. Ótimo vídeo! Agradeço pela ótima didática. Eu tive uma dúvida: porque no código você usou
    Ns = 1000 e outro de 10000? Também n = 10 e n =20. Não ficou muito claro para mim

    • @FranciscoRodrigues
      @FranciscoRodrigues  Před 3 lety

      Olá, na verdade essa escolha é arbitrária. Ns é o número de simulações. Quanto maior, melhor é a aproximação. n é o tamanho da amostra e quanto maior, melhor é a estimação também. Você pode baixar os códigos e testar como os resultados variam se você alterar Ns e n.

  • @rodrigo-pereira
    @rodrigo-pereira Před 4 lety

    Boa tarde professor.
    Estava na dúvida sobre quando usar a distribuição normal ou a de t de Student, mas o diagrama em 33:40 veio a calhar.
    Obrigado.
    Fiquei na dúvida pois no curso de inferência estatística do Coursera entendi que a estatística t é usada quando temos a situação de ou não conhecer σ ou quando queremos confrontar se duas ou mais amostras partem da mesma função geradora.
    Mas me parece que é o caso de não sabermos σ ou quando a amostra é pequena.
    Correto?

    • @FranciscoRodrigues
      @FranciscoRodrigues  Před 4 lety

      Olá Rodrigo, na verdade depende de dois fatores: se você conhece sigma e do tamanho da amostra. Se a amostra for pequena e sigma desconhecido, você deve usar a distribuição t. Para amostras grandes a distribuição t fica muito próxima da normal. Note que para N>50 nós usamos a distribuição normal.