ホーム > >

Excelデータ分析ツールで重回帰分析を実行する

Excelデータ分析ツールを使用して重回帰分析を実行することは、基本的に単回帰分析と同じです。ただし、一部のコンピューターはオフィスソフトウェアをインストールする時にデータ分析ツールをロードしないため、ロードから説明します。(Excel2008バージョンを例にします。他のバージョンも対応するインターフェイスがあります)

次の図に示すように、[ファイル]をクリックします。

次の図に示すように、ポップアップメニューで[オプション]を選択します。

ポップアップの[オプション]メニューで[アドオン]を選択し、[アドイン]のアクティブなアプリケーションから[分析ツール]を選択し、[設定]をクリックします。次の図に示すようになります。

ポップアップの[アドイン]メニューで[分析ツール]を選択し、[OK]をクリックします。

ロードした後、「データ分析」ボタンが「データ」ツールバーに表示されます。

元のデータは下記の図に提供しています。独立変数の値はセル範囲A2:I21にあり、従属変数の値はセル範囲J2:J21にあります。

回帰式が次のようになっているとします。

Excelデータ分析ツールの回帰分析ツールを使用して、回帰係数を推定し、回帰分析を実行してみましょう。

[データ]ツールバーの[データ分析]ボタンをクリックします。

ポップアップした[データ分析]ウインドウで[分析ツール]リストから[回帰分析]を選択し、[OK]をクリックします。

[回帰]ダイアログボックスがポップアップされ、次の図に従って選択します。

上記の操作の具体的な手順は次のとおりです。

「入力Y範囲」で、右側の折りボタンをクリックして関数Yデータが配置されているセル範囲J2:J21を選択し、折りボタンをクリックして選択後に戻ります。この過程は、「入力Y範囲」テキストボックスにJ2:J21を直接入力できます。

「入力X範囲」で、右側の折りボタンをクリックし、独立変数データが配置されているセル範囲A2:I21を選択し、折りボタンをクリックして選択後に戻ります。この過程は、「入力X範囲」で、右側の折りボタンをクリックし、テキストボックスにA2:I21を直接入力できます。

有意水準にチェックマークをつけて、デフォルトの95%にすればいいです。

「出力オプション」に「新しいワークシート」を選択すると、分析した結果が新しいシートに出力されます。結果を比較しやすいため、同じワークシートの空白範囲を選択します。例の場合はセルK10からです。[OK]をクリックすると、出力結果は次のようになります。

最初のテーブルは「回帰統計」(K12:L17)です。

その中で:

Multiple R:(複数の相関係数R)R2の平方根は、相関係数とも呼ばれ、独立変数xとyの間の相関性を測定するために使用されます。 この例のR=0.9134は、強い正の相関関係を示しています。 (Multiple:複数)

R Square:複素数決定係数、上記の複素相関係数Rの平方です。独立変数が従属変数yの変動を説明して、従属変数yの近似効果を説明するために使用されます。この例では決定係数は0.8343であり、独立変数によって説明できる従属変数の83.43%の変動を示しています。

Adjusted R Square:複数決定R2の調整済み係数で、値は0.6852であり、独立変数が従属変数yの68.52%を説明し、従属変数yの31.48%が他の要因によって説明される必要があることを示します。(Adjusted:調整済み)

標準誤差:適合値の計算に使用され、回帰に関連する他の統計の計算にも使用されます。値が小さいほど、適合度は高くなります。

観測値:回帰式のデータの観測値の数量を推定するために使用されます。

2番目のテーブルは「分散分析表」です。主にF検定を通じて回帰モデルの回帰効果を決定します。

この例のSignificance F(有意F)のP値は0.00636であり、有意水準は0.05未満のため、回帰式には有意な回帰効果があり、式には少なくとも1つの回帰係数が0に有意ではありません。(Significance:有意)

3番目のテーブルは「回帰パラメータ」です。

K26:K35は、定数の合計b1〜b9のデフォルトのソートです。

L26:L35は定数の合計b1〜b9の値です。これに基づいて、推定される回帰式は次のようになります。

この表で重要なのは列Oです。この列にあるO26:O35のP値は、回帰係数t統計量のP値です。

b1、b7のt統計量のP値は0.0156と0.0175であり、有意水準の0.05よりもはるかに小さいため、これら2つの独立変数はyに関連性があることに注意してください。他の項目のt統計量のP値はb1とb7のt統計量のP値よりもはるかに大きいですが、このような大きなP値は、これらの独立変数が従属変数と相関性がないことを示しています。これらの回帰係数は明らかではありません。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です