
今回は、単回帰分析の発展版として、重回帰分析についての説明を行っていきます。
重回帰分析が分かると、ある事象が起きる原因や影響度の調査、また改善施策の提案など、実務の現場でも幅広く役立てることができます!
是非この機会にしっかり身につけておきましょう!
この記事を読むと分かること
- 重回帰分析とは
- 単回帰分析と重回帰分析の違い
- 重回帰分析の活用場面
- 重回帰分析の出力結果の読み取り

是非最後まで楽しんで読んでいただければ幸いです!
単回帰分析については以下の記事をご覧ください!
「単回帰分析とは Excelでの求め方や活用事例とともに解説」
重回帰分析とは?
重回帰分析を一言で表すと、原因とみられる複数の要素が結果にどの程度影響を与えているのかを数値化し、複数の要素から結果を予測できるようにする分析手法のことです。
一言で表すとなんだか堅苦しい印象を受けますが、分析の流れや仕組みは単回帰分析とほとんど同じです。
単回帰分析についても少しおさらいしながら、単回帰分析と重回帰分析の違いや重回帰分析の特徴について見ていきましょう!
単回帰分析のおさらい
単回帰分析は、原因とみられる1つの要素からある結果を予測するための手法でした。
原因にあたる変数は「説明変数」と呼ばれ、結果にあたる部分は「目的変数」と呼ばれています。
単回帰分析で結果を予測する際には「y=ax+b」という直線の式を用いて、xの部分に説明変数の値を代入することで、yの目的変数の値を予測していくという流れでしたね。
単回帰分析との違い
重回帰分析でも、さきほど出てきたような「説明変数」「目的変数」という用語は同じように使います。
原因から結果を予測するという分析の根底にある目的も同じです。
しかし、重回帰分析は「説明変数が複数存在している場面」で結果を予測する場合に用いる手法なので、結果を予測する際に用いる式が単回帰分析と異なります。
重回帰分析で結果を予測するために用いる「回帰式」は以下のようになります。
aやbで表されている部分は「偏回帰係数」と呼ばれます。
重回帰分析のメリット
重回帰分析では、原因とみられる複数の変数から結果を予測するというのが一番大きな目的です。
そして、複数の変数を用いて結果を予測しているので、それぞれの変数が結果にどの程度の影響を与えているのか、影響の大きさを比較することができるという点が、重回帰分析の大きなメリットです。
先ほど紹介した回帰式の中にある偏回帰係数は、温度や個数などそれぞれの変数で単位が異なるので、結果への影響をそのまま比較することはできません。
しかし、そこで変数を標準化した「標準化偏回帰係数」というものを算出することで、どの変数が結果に大きく影響を与えているのかを比較することができるようになります!
これは単回帰分析にはできない、重回帰分析ならではの特徴です。
重回帰分析の活用場面
単回帰分析について解説した記事でも紹介しましたが、回帰分析は科学領域、マーケティング領域など幅広い領域で活用することができる分析方法です。
重回帰分析は、結果と関連がありそうな変数が複数ある場合でも予測をすることができる手法なので、単回帰分析よりもさらに汎用性は高くなるかもしれません。
例えば、ある薬の効果は年齢だけではなく、性別、肥満度、元々持っている疾患の有無とも関連している可能性がある場合には、単回帰分析よりも重回帰分析を行った方が予測の精度が上昇します。
また、飲食店の新店舗の売り上げを予測したいと考えている時に、系列店の売り上げに影響を与えている要因から予測をする場合には、店舗の広さや駅からの距離など様々な要因が売り上げに影響を与えていると考えるのが妥当です。
科学の分野でもマーケティングの分野でも、たった1つのことが原因で物事が起きていると考えられる場面は少ないと思います。
だからこそ、重回帰分析は単回帰分析よりも使い勝手の良い分析方法だといえるでしょう。
重回帰分析の出力結果の読み取り
それでは、Excelを用いて実際に重回帰分析を行ってみましょう。
今回は、飲食店の年間売り上げに影響を与えている複数の要因から、新店舗の売り上げを予測してみたいと思います。
上のデータのように、各店舗の売り上げには駅からの距離、敷地面積、駐車台数、店舗ごとに独自のフェアを行っているかどうかが関係しているのではないかと考えたとします。
駅からの距離、敷地面積、駐車台数、店舗独自のフェア実施の有無を説明変数、年間売り上げを目的変数として重回帰分析を行います。
ここで注意点があります。
今回の例のような「店舗独自のフェアの有無」は通常「あり」「なし」などの2つの選択肢で表されます。
しかし重回帰分析を行う場合は、これを数値に置き換える必要があります。
回帰分析はそれぞれの要素の影響を数値で表すことが目的なので、「あり」を1、「なし」を0といった数値に置き換える作業を行ったうえで分析を進めていきます。
出力結果の読み取り方
Excelでの回帰分析の実施方法は「単回帰分析とは Excelでの求め方や活用事例とともに解説」で詳しく紹介しているので、ここでは分析の流れについての説明は割愛します。
一点注意点として、重回帰分析は説明変数が複数あります。
そのため、分析ツールを開いた時に「ラベル」にチェックを入れるのを忘れないようにしてください。
今回は分析の流れよりも、出力された重回帰分析の結果をどのように解釈していけば良いかに焦点を当てていきたいと思います。
重回帰分析を行った結果、上のような表が出力されました。
ぱっと見では単回帰分析と同じような結果が出力されていると思いますが、一番下の表に複数の説明変数に対する結果が出力されているのが分かるかと思います。
結果の見方についてですが、重回帰分析の場合には「自由度調整済み決定係数」と呼ばれる「補正R2」の値を見て、上手く説明が出来ているかを判断すると良いと思います。
「補正R2」も「重決定R2」と同様に、1に近づくほど上手く説明が出来ていることを表しているので、今回の重回帰分析で求められた式を用いれば、新店舗の売り上げも上手く予測できることを表しています。
また一番下の表は、それぞれの説明変数がどれほど結果に寄与しているのか、本当に結果に影響を与えられる変数なのかを検討した結果となっています。
この結果から、新店舗の年間売り上げを予測する際にはこのような式を用いれば良いということが分かります。
例えば新店舗をオープンさせたい場所が、駅から700m、敷地面積が350m²、駐車台数は20台だった時に、店長の意向で独自のフェアを実施する場合には年間約1257万円の売り上げ、独自フェアを行わない場合には年間約1418万円の売り上げが見込める、ということが分かります。
一番下の表に出力されているP値は、それぞれの変数が結果に影響を与えることができる意味のある変数かどうかを表しています。
p値が0.05を下回っていれば意味のある変数だと言えますが、今回の場合は駅からの距離に対するp値が0.05を上回っているので、回帰式に強く影響を与える変数ではない可能性があります。
このような場合には、駅からの距離を除いて再び重回帰分析を行ってみると、より精度の良い回帰式が出来上がる場合があります。
まとめ
今回は、重回帰分析について活用場面や、Excelで分析を行った際の結果の解釈について紹介していきました。
今回は基本的な解釈についてのみ解説しましたが、重回帰分析の場合にはどのデータを説明変数に持ってくるべきかなど、判断が難しい場面もあると思います。
しかし重回帰分析はとても重要な分析手法の1つなので、使いこなせるように実際に手を動かしながら継続して学んでいきましょう!
この記事を読んだ人にオススメの記事はこちら!