Excel 統計学

重回帰分析とは 活用場面や単回帰分析との違いとともに解説

こんにちは。統計ブロガーのにっしーです。この記事を読むと、以下のことが分かるようになります!

この記事を読むと分かること

  • 重回帰分析とは何ぞや?
  • 単回帰分析と何が違うの?
  • 重回帰分析の活用場面
  • Excelを使って重回帰分析をやる方法

重回帰分析が分かると、原因や影響度の調査・改善施策提案など、実務でも非常に役立ちます!

是非最後まで読んでみてください!

単回帰分析については、以下の記事をご覧ください!

単回帰分析とは Excelでの求め方や活用事例とともに解説

重回帰分析とは?

重回帰分析を一言で表すと、「原因とみられる複数の要素が結果にどの程度影響を与えているのかを数値化し、複数の要素から結果を予測できるようにする分析手法」です。

一言で表すとなんだか堅苦しい印象を受けますが、分析の流れや仕組みは単回帰分析とほとんど同じです。

単回帰分析についても少しおさらいしながら、単回帰分析と重回帰分析の違いや重回帰分析の特徴について見ていきましょう!

単回帰分析のおさらい

単回帰分析は、原因とみられる1つの要素からある結果を予測するための手法でした。

原因にあたる変数は「説明変数」と呼ばれ、結果にあたる部分は「目的変数」と呼ばれています。

単回帰分析で結果を予測する際には「y=ax+b」という直線の式を用いて、xの部分に説明変数の値を代入することで、yの目的変数の値を予測していくという流れでしたね。

単回帰分析との違い

重回帰分析でも、さきほど出てきたような「説明変数」「目的変数」という用語は同じように使います。

原因から結果を予測するという分析の根底にある目的も同じです。

しかし、重回帰分析は「説明変数が複数存在している場面」で結果を予測する場合に用いる手法なので、結果を予測する際に用いる式が単回帰分析と異なります。

重回帰分析で結果を予測するために用いる「回帰式」は以下のようになります。

aやbで表されている部分は「偏回帰係数」と呼ばれます。

重回帰分析だからこそ分かること

重回帰分析はもちろん、原因とみられる複数の変数から結果を予測するというのが一番大きな目的ですが、複数の変数を用いて結果を予測しているので、それぞれの変数が結果にどの程度の影響を与えているのか、影響の大きさを比較することができます。

先ほど紹介した回帰式の中にある偏回帰係数は、温度や個数などそれぞれの変数で単位が異なるので、結果への影響をそのまま比較することはできませんが、変数を標準化した「標準化偏回帰係数」というものを算出することで、どの変数が結果に大きく影響を与えているのかを比較することができるようになります!

これは単回帰分析にはできない、重回帰分析ならではの特徴なので、興味のある方は「標準偏化回帰係数」についても勉強してみると良いと思います!

重回帰分析の活用場面は?

単回帰分析について解説した記事でも紹介しましたが、回帰分析は科学領域、マーケティング領域など幅広い領域で活用することができる分析方法です。

重回帰分析は、結果と関連がありそうな変数が複数ある場合でも予測をすることができる手法なので、単回帰分析よりもさらに汎用性は高くなるかもしれません。

例えば、ある薬の効果は年齢だけではなく、性別、肥満度、元々持っている疾患の有無とも関連している可能性がある場合には、単回帰分析よりも重回帰分析を行った方が予測の精度が上昇します。

また、この後の説明でも出てきますが、飲食店の新店舗の売り上げを予測したいと考えている時に、系列店の売り上げに影響を与えている要因から予測をする場合には、店舗の広さや駅からの距離など様々な要因が売り上げに影響を与えていると考えるのが妥当です。

科学の分野でもマーケティングの分野でも、たった1つのことが原因で、物事が起きていると考えられる場面は少ないと思うので、重回帰分析はとても使い勝手の良い分析方法だと言えると思います!

 Excelで重回帰分析をしてみる

それでは、Excelを用いて実際に重回帰分析を行ってみましょう。
今回は、飲食店の年間売り上げに影響を与えている複数の要因から、新店舗の売り上げを予測してみたいと思います。

上のデータのように、各店舗の売り上げには駅からの距離、敷地面積、駐車台数、店舗ごとに独自のフェアを行っているかどうかが関係しているのではないかと考えたとします。

駅からの距離、敷地面積、駐車台数、店舗独自のフェア実施の有無を説明変数、年間売り上げを目的変数として重回帰分析を行います。

ここで、店舗独自のフェアの有無は通常、「あり」「なし」などの2つの選択肢で表されますが、回帰分析はそれぞれの要素の影響を数値で表すことが目的なので、「あり」を1、「なし」を0といった数値に置き換えて分析を行っていきます。

結果の解釈は?

Excelでの回帰分析の実施方法は「単回帰分析とは Excelでの求め方や活用事例とともに解説」で詳しく紹介しているので、ここでは分析の流れについての説明は割愛します。

ただし、重回帰分析は説明変数が複数あるので、分析ツールを開いた時に「ラベル」にチェックを入れるのを忘れないようにしてくださいね!

今回は分析の流れよりも、出力された重回帰分析の結果をどのように解釈していけば良いかに焦点を当てていきたいと思います。

重回帰分析を行った結果、上のような表が出力されました。

ぱっと見では単回帰分析と同じような結果が出力されていると思いますが、一番下の表に複数の説明変数に対する結果が出力されているのが分かるかと思います。

結果の見方についてですが、重回帰分析の場合には「自由度調整済み決定係数」と呼ばれる「補正R2」の値を見て、上手く説明が出来ているかを判断すると良いと思います。

「補正R2」も「重決定R2」と同様に、1に近づくほど上手く説明が出来ていることを表しているので、今回の重回帰分析で求められた式を用いれば、新店舗の売り上げも上手く予測できることを表しています。

また一番下の表は、それぞれの説明変数がどれほど結果に寄与しているのか、本当に結果に影響を与えられる変数なのかを検討した結果となっています。

この結果から、新店舗の年間売り上げを予測する際にはこのような式を用いれば良いということが分かります。

例えば新店舗をオープンさせたい場所が、駅から700m、敷地面積が350m²、駐車台数は20台だった時に、店長の意向で独自のフェアを実施する場合には年間約1257万円の売り上げ、独自フェアを行わない場合には年間約1418万円の売り上げが見込める、ということが分かります。

一番下の表に出力されているP値は、それぞれの変数が結果に影響を与えることができる意味のある変数かどうかを表しています。

p値が0.05を下回っていれば意味のある変数だと言えますが、今回の場合は駅からの距離に対するp値が0.05を上回っているので、回帰式に強く影響を与える変数ではない可能性があります。

このような場合には、駅からの距離を除いて再び重回帰分析を行ってみると、より精度の良い回帰式が出来上がる場合があります。

まとめ

今回は、重回帰分析について活用場面や、Excelで分析を行った際の結果の解釈について紹介していきました。

今回は基本的な解釈についてのみ解説しましたが、重回帰分析の場合にはどのデータを説明変数に持ってくるべきかなど、判断が難しい場面もあると思います。

しかし重回帰分析はとても重要な分析手法の1つなので、使いこなせるように実際に手を動かしながら継続して学んでいきましょう!

データ分析を学びたい方へ

私自身、今ではデータ分析を仕事の一つにしています。しかし、未経験スタートだったので、周囲との差もあり非常に大変な思いをしました。

もし今転職をやり直すならば、あらかじめスクールに通って、ある程度知識を付けたうえで転職すると思います。

データ分析を仕事にしたい方は、一度無料の説明会に参加してみることをオススメします。

話を聞くだけでも、自分のキャリアを考えるいいキッカケになると思いますよ!

オススメポイント

  1. 年間2200名の社会人が受講している日本屈指のデータサイエンススクール
  2. データサイエンスの基礎や、Excelでのデータ分析など講座の種類が豊富
  3. 参加無料の説明会、体験会がある

↓無料で説明会に参加したい方は、以下のURLから!↓

【データミックス】データサイエンティスト育成スクールの無料説明会参加



  • この記事を書いた人

Nissy

同志社大学卒。 人事・経理、コンサルを経験し、現在はWebマーケティングやSEOライター、ブログ運営など、幅広い活動をしています。 【保有資格】 統計検定2級 統計調査士 ビジネス統計スペシャリスト ウェブ解析士 GAIQ(GoogleAnalytics個人認定資格) 全日本SEO協会認定SEOコンサルタント

-Excel, 統計学
-, , ,