はじめに
先日統計検定2級を受験し合格しました。本記事では学習方法や感想を記載します。
統計検定2級を受験した理由
第2子の育休期間のスキマ時間を使ってスキルアップをしたいと考えていました。日常のソフトウェア開発業務では応用的なスキルを身につけて課題解決をすることが多いですが、育休中のため業務とは直接的には関係のない、何かしらの学問など少し抽象的な内容を腰を据えて学習しようと思っていました。
以前機械学習のキャッチアップを目的に『ゼロから作るDeep Learning』という書籍を写経していたのですが、統計学や数学の知識不足により冒頭数十ページで挫折してしまった経験がありました。この経験から、いつかは統計学や数学について基礎から学習してみたいと考えていました。また、ソフトウェア開発におけるAIの重要度が激増しているため、そのベースとなる統計学の素養は中長期的にキャリアに効いてきそうだとも感じ、統計学の学習を開始することにしました。
後述の入門書を2冊ほど読んだどころ統計学の面白さを感じ、より深く学習を進めていきたいと考えるようになりました。適切な難易度の試験に合格することを短期の目標とすることで、その過程で問題演習を通じて知識の定着を図れるだろうと考え、「大学基礎課程(1・2年次学部共通)レベル」である統計検定2級の受験を決めました。
受験前の知識
- 大学時代は経済学部に所属していたため、必修科目として統計学を履修しました
- 当時は単位を取ることのみに注力していたため、学習した内容は全く覚えていませんでした
- 高校時代は数学IAⅡBを一通り学習し、少なくとも苦手意識はありませんでした
学習方法
学習スケジュール
おおまかな学習スケジュールはこんな感じです。
- 1~3週目: 入門書を読む
- 4~5週目: 問題を解く
試験に合格することを目的に学習を始めるならば先に過去問を見るのが王道でしょうが、先述の通り私の場合は純粋に統計学に興味があったので、まずは入門書をじっくり読み、その後問題演習に入りました。
入門書を読む
まずは、『完全独習 統計学入門』を読みました。今までなんとなく聞いたことのあった「標準偏差」について完全に理解でき、統計学の面白さに気づきました。本書は口語体であり読みやすく、本の触れ込みにもあるとおり中学数学のみしか使われていないという点からすんなり読破できました。入門書ではありますが1冊の書籍を読破できたことで、統計学の苦手意識がなくなり自信に繋がりました。
『完全独習 統計学入門』を読み終えたあたりから少し統計検定2級の受験を意識し始めていたため、次に2級の試験範囲をある程度カバーしている『入門 統計学(第2版)』を読むことにしました。こちらも口語体で読みやすい上に、さまざまな統計手法が載っており面白かったです。全体の3分の2程度を読んだ後、これ以降は演習を通して知識を定着させることにしました。
ちなみに、2冊目の入門書の選定にあたり以下の記事を参考にしました。
問題を解く
統計検定のCBT用の問題集を購入し、演習を行いました。演習を通して理解が曖昧だった点については『入門 統計学(第2版)』やWeb記事を確認しながら定着をさせていきました。問題集については間違いやすい問題を中心に3回解き直しました。
試験数日前に時間を計測して問題集に付属の模擬問題を解いたところ合格ギリギリの点数でした。意外と試験時間に余裕がないことに気づき、より効率的に問題を解く必要があることがわかりました。そこで、知っている問題のレパートリーを増やすことを目的に、PBTの過去問を購入し、理解が浅い問題を中心に2回ほど解きました。
使用した教材
入門書
『完全独習 統計学入門』は分散や標準偏差といった基本的な概念や正規分布、χ2乗分布、t分布といった確率分布の性質を理解するのに非常に役立ちました。「使うのは中学数学だけ」との触れ込み通りΣ記号すら出てこないため、数学にブランクのある自分でも読み通せたと思います。とはいえ、χ2乗分布を扱う第16講からは理解が難しくなり、数度読み直してやっと理解できた感じでした。『入門 統計学(第2版)』は統計検定2級で頻出の各種の検定、推定を理解するのに役立ちました。こちらも数式が少なめであるため、比較的つまりどころがなく読むことができました。
特に2級の試験範囲である以下の章について読み込みました。
- 第1章~第7章
- 第8章の一元配置分散分析
- 第10章のフィッシャーの3原則
- 第11章のχ2検定
- 第12章
問題集
問題集はCBT用のものと2011~2013年のPBT用の過去問の2冊を購入しました。
(余裕があればこちらもやりたかったですが、できませんでした。)
以下3冊はKindleで読めるので、寝ながら問題を解く用に購入しました。
ブログ
問題を解いていてわからない内容については、とけたろうさんのブログやYouTubeをよく見ていました。特にチートシートの記事は試験直前に総復習するのに非常に役立ちました。
受験してよかったこと
統計検定2級の学習を通じて、機械学習の理論を理解するためのスタート地点にやっと立てた気がしています。
また、エビデンスに基づいて意思決定することの重要さを知れたことも統計学を学習して良かったことの1つです。ソフトウェア開発をしていると意思決定をする機会が非常に多いですが、定性的な判断を下してしまったがゆえに招いた失敗がいくつもあったなと気づきました。もちろん定性的な判断が必要な局面があることは理解しつつも、今後はよりエビデンスに基づいた判断をしていきたいと感じています。
最後に
まだ育休期間は続くので、次に注力する分野を決めていきたいと思っています。CouseraのAndrew先生のMachine Learningコースの受講や統計検定準1級の受験などやりたいことを上げだすときりがないのですが、少し時間を置いてまた何かに挑戦していく所存です。