アウトプット①　1章　統計データの収集と分析（1.1節~1.3節）

この投稿は1章の1.1節～1.3節まで。

（インプットしたものを、アウトプットとしてブログに残すことが目的です。なので、このカテゴリは皆様の役立つ投稿とは言い難いこと、ご容赦ください。）

1.1節　母集団と標本
1.2節　記述統計・推測統計・意思決定
1.3節　データの種類

1.1節　母集団と標本

母集団と標本の概念から紹介だ。

私の理解から、

母集団	分析の対象となる集団全体
標本	データとして収集した対象

※　標本は、自然科学の分野では、全数調査をすることが難しい。

とまとめます。
総務省統計局の労働力調査では、標本として毎月4万世帯が調査対象。

ここで、2020年4月の完全失業率の速報値は2.6%とのこと。あくまで調査例として出てきたが、話は逸れて、この日本の数値をどう見るか、感慨深い。他国と比べても失業率は小さいと言えるだろう。

一方で、国別の年収の年別推移のデータがあったが、1990年代から日本はほぼ横ばい。韓国にも抜かれているのである。

失業者は少ない。「皆、平等、一律で生きよう」とういことか、日本は。一攫千金など狙う国ではない。分布から上位に外れた金持ちは、妬まれ、大量の税金を徴収される、と。結局国外で生きるというのも多いのだろう、と想像してしまう。
また、失業をそもそもさせない、という仕組みが見え隠れする。廃業・倒産してもおかしくない会社も生かしたままにする。よく言われるようになった「ゾンビ企業」だ。日本にとって本当にそれが国民を守る仕組みなのだろうか。新陳代謝が悪いという印象もある。創造的な起業家も生まれにくいのではないか。苦しんで苦しんで、希望も乏しいゾンビ企業にいるよりも、会社の傾ききる前に、従業員を新たな会社にすぐに送り出す、あるいは支援金を出して会社は早めに倒産をしてボロボロになる前に、次に進む、という仕組みもあるのではないだろうか。

脱線が過ぎました。

公的統計	政府が実施する調査
基幹統計	個人や企業に回答の義務が課される重要な統計

標本調査・・・（例）マスコミが実施する内閣支持率アンケート。有権者を母集団

大規模全数調査

国勢調査　5年ごと
経済センサス（すべての企業・事業所約600万の調査）　 5年に2回

以上、社会を対象とした多くの場合は有限母集団となる。

メンデルの遺伝の実験（さやえんどう）・・・・実験は限りなく繰り返しできる
→　無限母集団

標本の大きさ（サイズ）	ｎ　（小文字のエヌ）
母集団の大きさ（サイズ）	N　（大文字のエヌ）

「人口動態統計」は厚生労働省が調べて毎月公表。行政記録情報の統計化である。
出生性比は、毎年実施。男女比は1:1ではい。男の方が多く生まれる傾向が明らかに見えるのである。

1.2節　記述統計・推測統計・意思決定

記述統計は与えられた統計データを整理して表やグラフを作成すること。標本の特性を把握できる。

標本調査の手法

推定
仮説検定

これらを総称して統計的推測と呼ぶ。

また、伝統的な統計学の対象分野は3つ。

データの収集・観察の方法
記述統計
推測統計

データに基づく意思決定も、統計的手法に含めることもある。

1.3節　データの種類

変数・・・金額、数量など様々な特性として、特性分析の表やグラフのもととなるもの。

変数の分類にはいくつか基準がある。

質的変数
量的変数

別の切り口では、

クロスセクションデータ	ある特定の時点または期間でのデータ（調査対象の順番を入れ替え可能）
時系列データ	特定の系列を多数の異なった時点で観測したデータ（時間的順序が定められ、分析が一般的に難しい）

時系列データは、月次、年次、四半期データなどがある。

この2つのデータを組み合わせて、同一の対象を継続的に記録したもの

→　縦断的データ、パネルデータ

と呼ぶ。
例：企業の活動を記録したデータ。子の実態、経験変化の状況を断続的に観察、など。

追伸

コメントです。うーん。1章は、イントロ的な位置づけもあり、のめり込んで読むことはありませんでしたね。出てくるキーワードも日本語としてはインパクトの薄い、抽象的なワードが並びました。
ところどころで脱線もしながら、投稿することにも意味があると思ってますので、このスタイルを続けていきます。

以上です。

ではでは＠ちゃこぱ