講演内容
データを要約する時に、意外と頭を悩まされるのが外れ値です。
外れ値の定義や求め方は、実は難しい。
直感的には見た目で「このデータ、他のデータからすごく離れたところにあるな」と思うようなデータは外れ値になるのだと思います。
ただ、外れ値と外れ値ではない値の明確な違いがないのが現実です。
例えば、平均値から3SDより離れたところにあるデータは外れ値とする、などといった定義を作ることは可能です。
ですが、それも他の第3者から見れば、「なんで外れ値はこんな定義なの?」ってなります。
外れ値を統計的検定で除外する、という方法もありますが、検定だとデータ数が多くなれば必ず外れ値が出てきますし・・・。
ということで、この動画では外れ値に関して深く考えてみます。
セミナー概要
| 見逃し配信 | 永続的に視聴可 |
| 講師 | 吉田 寛輝 様 株式会社データシード 代表取締役 |
| 参加費 | 0円(税込) |
