はじめまして。ちゃこぱです。初投稿です。
県庁所在地別の世帯消費を検証

日本は国及び地方公共団体はオープンデータに取り組むことが義務付けられました。このオープンデータをAIを使ったりして、企業の方々はマーケティングの材料として、使っている方もいるでしょう。
このカテゴリーでは各種のデータをみて、そのデータが別のデータと関係性があるかもしれないと仮説を置いてみて、実際にグラフで見える化して、関係性が強くあるのか、ないのか、検証してみることとしました。
ワインとチーズの関係性は?
この投稿では2020年の都道府県庁所在地別の消費額の生データを検証します。データは1世帯あたりの年間の消費額です。仮説を考えた動機は単純で、ワインをたくさん飲むのであればチーズの消費も多いだろう、と。逆もしかりで、チーズをたくさん消費するのであれば、ワインを大量に飲む地域があってもよいでしょう、と。
その関係性が地域別でみればどうなるか?興味深いので定量的に料理してみました。
前提として
その前に、相関性については、今回グラフ上では「曲線的な」関連性を示す、決定係数も出しつつも、わかりやすく「相関係数」としてその数値をもって、関係性が強いのか弱いのかを示します。
やや込み入った細かい違いが決定係数と相関係数ではあるのですが、このブログではグラフでは直線的ではない、曲線近似で関係性を示しつつも、相関係数の値を用いていきます。
評価基準は・・・
相関係数からはざっくりですが、
- 相関係数が1に近い : 正の相関
- 相関係数が-1に近い : 負の相関
- 相関係数が0に近い : 相関がない
上記の3つの相関がわかります。デファクトスタンダード(経験的な事実上の標準)になっていると思われるのが、以下の基準です。この値を用いて判断していきます。
相関係数 | 相関の強さ |
---|---|
-1 ~ -0.7 | 強い負の相関 |
-0.7 ~ -0.5 | 負の相関 |
-0.5 ~ 0.5 | 相関なし |
0.5 ~ 0.7 | 正の相関 |
0.7 ~ 1 | 強い正の相関 |
では本題
グラフにしてみましょう。X軸が、ワインの消費額。Y軸がチーズの消費額(いずれも円/年:2020年)。下記の通り。

相関係数は、0.67です。一番強い相関群には入らないものの、それなりの相関があるといっていいですね。ワインのよく飲む県庁所在地は、「それなりに」チーズもよく食べると考えていいでしょう。思った通り、東京区部はいずれも消費額はダントツで1位であり、グラフの右上の隅の方にいるのがわかります。
また近似線を曲線で示すと、プロット(各県庁所在地)がその近似線から乖離したものもあります。 これはマーケティングとして、使えそうです。例えば、山梨県甲府市。さすが日本の代表的なワインの生産地です。ワインの消費が2位ですが、それに対して近似線の下側にあるということは、相対的にチーズの消費額は少ない、ということですね。つまり、チーズの販売チャンスがこの地域では十分にあると言えそうです。秋田市、福岡市もチーズの販売チャンスがあると同様に言えそうです。
横浜市は・・・
一方で神奈川県横浜市。チーズの消費量の多さのわりに、近似線から上の方に大きく乖離してます。これは逆のことが言え、まだまだワインの販売チャンスがありそうですね。
奈良市はどちらの消費も💮
意外だったのが奈良市です。チーズもワインも高い消費額であり、この事実から、例えば他の欧州料理や、様々な銘柄のワインもPRすれば、販売促進になりそうです。
いずれの商品に関わる販売関係者には、これらのエリアで商品のPRをもっとする価値がありそうです。
まとめ

公共団体のオープンデータを料理して、ワインとチーズの消費額の相関性を都道府県庁所在地別にみてみました。
- ワインとチーズの消費に相関あり
- 甲府市、秋田市、福岡市にはチーズをPR!
- 横浜市にはワインをPR!
上記の通りでした。
データの料理は始まったばかりです。今回はマーケティングの一助になるものを料理してみました。料理をして、意外な発見が見いだせれば有意義です。
ではでは@ちゃこぱ