ml

機械学習や統計、データ、分析に携わる人が読んできおきたい本

[書評] それ、根拠あるの?と言わせない データ・統計分析ができる本
[書評] それ、根拠あるの?と言わせない データ・統計分析ができる本[書評] それ、根拠あるの?と言わせない データ・統計分析ができる本

それ、根拠あるの?と言わせない データ・統計分析ができる本

データ分析に携わるのであれば、一回は読んで置きたい本です。
初級から中級向けですので普段からデータ分析をやっていて、得意という方は必要ないです。

私も機械学習エンジニアとしてまたはKPI分析で仕事をはじめてから読みました!

データ収集

多くの企業やサービスが最初に困るのがデータがないということだと思います。

データの”軸”に着目する

「それ、根拠があるの?と言わせないデータ・統計分析ができる本  p34」

データの軸

売上というデータ1つとっても、時間場所顧客商品といったように様々な軸に分けることができます。これだけで4倍のデータが手に入ります。

つまり、データは視点で変わる!

データから推測

データから様々なことが推測ができます。市場規模なんかがいい例だと思います。

市場規模 = 1個あたりの平均価格 × 販売個数

で求めることができます。フェルミ推定の基本ですね。

外資系コンサルタントや上級のデータ 分析者はこの推定力が並外れています。

多くの人が持っている情報から答えを導く力がずば抜けています。

推測力を鍛えるだけで、第一線で活躍できるようになります。

まず、第一歩として平均値中央値を覚えましょう!

 

平均値と中央値

平均という言葉、多くの人が耳にしたことがあると思います。

「全体の真ん中!!!!」

いえ、違います。

平均値とは、文字通り平たく均した数値です。

例えば、労働者の平均年収は400万円という数字は、1人の年収4,000万円と9人の年収0円の人でも怒ってしまうのです。

 

外れ値

こういった、4,000万円といった数字を外れ値といいます。

そして、外れ値があっても全体の真ん中を表す数値を中央値といいます。

中央値の求め方は、下記サイトが詳しく解説していますのでこちらを参照してみてください。

 

平均値と中央値を比較して、「外れ値」のフィルターにする

「それ、根拠があるの?と言わせないデータ・統計分析ができる本  p67」

データ分析の基本の「き」に触れることができたと思います。

実際の現場では、ここまで優しく解説してくれる上司はいないと思います。

当たり前として進みます。このレベルの知識は身につけてから、どや顔でいきましょう!

ABOUT ME
ロッピー
コンサルタントから2018年にエンジニアに転向。年収400万円のサラリーマンエンジニアから、半年で月収100万円を稼ぐエンジニアになった。 Python、Golangなど単価の高い言語を得意とする。