説明変数を増やすと必ずR2が大きくなる。変数選択したいなら自由度調整済決定係数の出番です!

Sdílet
Vložit
  • čas přidán 18. 07. 2021
  • 今回は、自由度調整済決定係数についてわかりやすく解説します。
    重回帰分析では、予測モデルに使用する説明変数の数を増やすと、決定係数R2は必ず大きくなります。だから、説明変数を予測モデルに加えたことに効果があったのかどうかはR2では判断できません。
    自由度調整済決定係数は、目的変数と関係のない説明変数が予測モデルに追加された時には大きくならず、目的変数と関係のある説明変数が予測モデルに追加された時には大きくなります。
    重回帰分析において、予測モデルに使用する説明変数の選定をしたい時には、自由度調整済決定係数を用いましょう!
    QC検定のお勉強にもお役立てください。
    皆さまのお役に立てる動画配信をしていきますので、応援していただけると嬉しいです(^-^)
    =======================
    【関連動画】
    ▼重回帰分析が有効な場合はどんな時?利点は?単回帰分析との違いもわかりやすく解説!
      • 重回帰分析が有効な場合はどんな時?利点は?単...
    ▼決定係数R2をわかりやすく解説!絶対に1は超えないが0を下回ることはある。
      • 決定係数R2をわかりやすく解説!絶対に1は超...
    ▼高使用頻度の『回帰分析』を爆速でマスター!
      • 高使用頻度の『回帰分析』を爆速でマスター!
    =======================
    チャンネル登録はこちら
    ☞ / @datasciencelab.
    #QC検定1級成績優秀表彰者が解説します

Komentáře • 13

  • @Takoyaki475
    @Takoyaki475 Před měsícem +1

    最近統計の勉強しないといけなくなったので助かってます

  • @metabomaguro
    @metabomaguro Před 2 lety +7

    自由度調整済み決定係数の理解が深まりました。わずか10分の動画で人に感動をあたえるのは素晴らしいと思います。本来なら、自分で調べようとすると相当な時間を要するものを、たった10分で統計学難民を理解させるのは本当に素晴らしい活動だと思います。

    • @DataScienceLab.
      @DataScienceLab.  Před 2 lety +3

      ありがとうございます(^-^)
      私自身が統計学難民だったので、『当時の私が観たい動画』をコンセプトにしてます!

  • @saitama9503
    @saitama9503 Před 29 dny +1

    なるほど!!
    >> 3:00
    線は2次元でしか動けませんが、面は3次元で動けます。
    説明変数を増やすと、回帰モデルが自由に動ける範囲が広がるので、残差平方和が小さくなるような回帰モデルを見つけやすくなるんですね。
    だから、説明変数が増えると、必ず残差平方和が小さくなるんです。
    残差平方和が必ず小さくなるということは、R2が必ず大きくなる、というわけです。

  • @user-we4bz1xd1r
    @user-we4bz1xd1r Před rokem +1

    わかりやすい動画ありがとうございます!今重回帰分析の勉強しているので助かります
    質問なのですが
    訓練用データで作成した予測モデルの精度を調べるために、テストデータで予測を行った場合の自由度調整済み決定係数を算出する際の計算で用いるデータ数:nは訓練用データのデータ数でしょうか、それともテストデータのデータ数なのでしょうか。

    • @DataScienceLab.
      @DataScienceLab.  Před rokem +2

      テストデータのデータ数です。
      交差検証は、同じモデルでの評価なので、自由度調整済決定係数ではなく、決定係数による評価で問題ないかと思います!

    • @user-we4bz1xd1r
      @user-we4bz1xd1r Před rokem +1

      @@DataScienceLab. 返信くださりありがとうございます!
      テストデータで自由度を調整するとマイナスになってしまうことがあまりにも多かったので自由度調整しなくていいのではと薄々思ってはいたのですが、決定係数での評価で良い理由を論理的に説明できないので自由度調整してました🥺
      もしよろしければ自由度調整済み決定係数と決定係数はどのような場面で使い分けるのか教えていただけますか

    • @DataScienceLab.
      @DataScienceLab.  Před rokem +2

      自由度調整済決定係数を使うべき場面は、説明変数の数を増やしたり減らしたりした時に、モデルの精度が向上したかどうかを評価したいときです!

    • @user-we4bz1xd1r
      @user-we4bz1xd1r Před rokem +1

      @@DataScienceLab. わかりました!ありがとうございます!

  • @inps7180
    @inps7180 Před rokem +1

    いつもとても勉強になっております。ありがとうございます。
    ご質問よろしいでしょうか。
    czcams.com/video/An0oFJsmcxg/video.html
    こちらの動画で自由度を考慮できない決定係数だけでなく、それが考慮できる分散比のP値も確認すべきであると習いました。
    ただ本動画の自由度調整済決定係数は自由度を考慮している数値だと思われます。
    回帰式の分散分析結果と自由度調整済決定係数の使い分けはあるのでしょうか。
    分散分析では有意でなく、自由度調整済決定係数が大きい場合はあるのでしょうか。

    • @DataScienceLab.
      @DataScienceLab.  Před rokem +4

      私が普段、各指標をどんな場面で使用しているのかを紹介します。
      回帰式の有意性(分散分析のp値)については、『目的変数のばらつきや説明変数の数に対して、データ数が十分であったのか?』『そもそも構築した回帰モデルは数学的に信頼に足りそうか?』などを判断する際に参考にします。
      自由度調整済決定係数については、『説明変数の数を増やした時に、説明変数を増やしたことに意味があったのか?逆に減らした時に、減らしたことに意味があったのか?』を判断する際に参考にします。
      モデル構築に使用するデータによっては、分散分析では有意ではなく自由度調整済決定係数が大きい場合はあるかと思いますが、自由度調整済決定係数は、あくまでも説明変数の増減による影響を評価する際に使用するスタンスです。

    • @inps7180
      @inps7180 Před rokem +1

      早速ありがとうございます。理解できました。引き続き勉強させていただきます。
      PS .スーパーサンクスをしようとしましたが、ボタンがないので、おそらく設定されてないのですね(もしくは総再生時間がまだ少ないのでしょうか)。素敵なコンテンツだと思い、サンクスを送りたい人もいると思うので、解放しても良いと思いました。
      データサイエンスLab.さんの理念に反するのであれば、それはそれで良いのですが。

    • @DataScienceLab.
      @DataScienceLab.  Před rokem +2

      ありがとうございます(^-^)
      自己研鑽の一環としてやっておりますので、そのお気持ちだけで十分嬉しく思っています!
      が、貴重なご意見いただきましたので、検討させていただきます。