『統計データという怪物』

厚生労働省が作成する統計(毎月勤労統計調査)で、不正が行われていたことが波紋を呼んだことは記憶に新しいところです。毎月勤労統計調査とは、賃金や労働時間に関する統計で、調査結果はGDP(国内総生産)の算出にも用いられるなど、政府における基幹統計の一つとして位置づけられています。この統計が正確でないと、労働者の賃金が上がったのか下がったのか、残業が増えたのか減ったのかなどの労働環境の変動について正しく把握することが困難になってしまいます。

統計データを改ざんしたりする不正行為が問題であることは当然ですが、統計処理は専門分野であり、何がどのくらい悪いことなのかについては、いまひとつ、ピンと来ない人も多いのかも知れません。統計処理の中身(手法や実際の処理プロセスなど)が理解できないと安倍政権に対する忖度の有無も判断できません。東京大学教授の佐々木 彈さんは自身の著書『統計は暴走する』(中公新書クラレ)の中で次のように述べています。

インターネットに限らず、現代社会に氾濫する情報、その非常に多くに統計が含まれています。だからこそ、情報の大海原とも言うべき現代社会を航海しなければならない皆さんに要求されるリテラシー、その主要部分は「統計リテラシー」ということになります。いい加減な統計をネットで見たから、活字で読んだから、大手メディアで耳にしたから、というだけで漫然と妄信するようでは、直接的に金品を巻き上げられなくても、半ば詐欺に引っ掛かっているのと同じなのです。

インターネット社会においては、情報に対するアクセスが容易になればなるほど、情報内容を適正に吟味するスキルが要求されます。情報を適正に吟味するスキルの内、統計リテラシーが最重要であることは言うまでもありません。

統計リテラシーとは、統計データから出来るだけ多くの状況を判断することにあるように思います。所謂、5W1H、Who(誰が)、What(何を)、Where(何処で)、When(何時)、Why(なぜ)、How(どうしたか)を念頭に置きつつ統計データを読むことが重要だと思います。

 Who:誰がその統計を集め、分析し、発表し、解釈しているのか。
 What:何を記述し分析した結果なのか。
 Where:統計データの出所はどこか。
 When:どういう文脈で行われ発表された統計分析か。
 Why:どういう目的のために行われたか。
 How:分析は統計(学)的に適切か。

さらに、統計リテラシーを向上させるためには、批判的に読む弁証法で考える常識を働かせる発信者側に立ってみることも重要であると言われます。

今回の厚生労働省不正統計問題について、統計リテラシーに照らして改めて整理してみると、これまで見落としてきた視点が得られるかもしれません。

私事で恐縮ですが、大学院(ビジネススクール)時代に統計学をかじりました。中でも特に強く印象に残っていることが、「因果関係と相関関係は異なる」という点です。例えば、「Aが多いほど、Bも多い傾向がある」といった場合に、「AとBは正の相関関係がある」と言います。逆に「Aが多いほど、Bは少ない傾向がある」という場合は「AとBは負の相関関係がある」と言います。一方、因果関係とは「原因と結果」のつながりがある関係のことです。「Aが原因となってBという結果が起きる」関係と言えば分かりやすいでしょうか。二つの変数の動きに構造的関連が不在で、あくまで偶然の連動のことを「疑似相関」と称します。“猫が顔を洗うと雨が降る”、“インターネットが普及するにつれ、地球温暖化が進行する”、“趣味が盆栽という人ほど、お金持ちである”などなど、所謂ジンクスと呼ばれている内容の多くはこの疑似相関を指します。他人の空似ですね。

ある事象が統計的に有意(意味がある)であるか否かは主観的な概念です。通常少しでも客観性を確保するため仮説検定というプロセスを踏みます。統計的に有意であるとは、「○○%有意」の意味であり、「○○%」のことを統計学では、「P値」と言います。このP値をデータに基づいて算出するプロセスを統計的仮説検定と言います。このプロセスはEXCEL(エクセル)で比較的容易に出来てしまいます。皆さんの組織でも多くの統計データが散見されるかと思います。この仮説検定というプロセスを試してみてはいかがでしょうか。また、仮説検定までいかなくても(少しハードルが高いと感じる方もいらっしゃるかもしれません)、この機会にご自身の統計リテラシーについて見直してみることをおすすめします。統計データという怪物との上手なつきあい方について考えてみましょう。

岡田 英之

JSHRM 執行役員
Insights編集長 岡田 英之


これより先のページは会員限定のページとなっています。
事務局より発行されました「ユーザー名とパスワード」にてログインください。

既存ユーザのログイン