はじめに
本記事はAWS その2 Advent Calendar 2020 23日目の記事です。
2020年の12月にAWS 認定 機械学習 – 専門知識(以降MLS)に合格してきました。
合格体験記としてこれから受験する方が学ぶべき内容と実際に自分がどういった情報を基に学習してきたかを記載していきます。
結論(これから受験する方が学ぶべき内容)
先にシンプルな結論(?)として合格した自分の思うこれから受験する方が学ぶべき内容を紹介します。
下記の3本立ての学習が必要です。括弧内の%は自分が感じた出題の比率の数字です。
- 機械学習の基礎知識(40%)
- AWSの機械学習関連の各種サービスの機能(30%)
- AWSのデータ関連の各種サービスの機能(30%)
機械学習の基礎知識で特に重要なのは過学習への対処、陽性データが少ない場合の対処、学習に時間がかかっている場合の対処といったデータサイエンティストが日常的にぶつかる問題への対処方法です。
この辺りは王道の解決手法(過学習が起きているなら正則化、陽性データが少ないならオーバーサンプリングといったセオリー)を理解できていることが求められます。
後は評価指標、特に混同行列に関しては手を替え品を替え様々な問題形式でしつこいくらいに問われます。
AWSの機械学習関連の各種サービスに関しては下記のサービス別資料のうち「Machine Learning」の章のサービスの機能の概要は抑えておきましょう。
下記に記載のないTranscribe、記載のあるLex、Pollyを組み合わせた対話型システム、各サービスのユースケースについては繰り返し問われます。
SageMakerも重要は重要ですが、事前に合格体験記等で見たよりも細かい話は問われなかった印象を受けました。
SageMaker関連で抑えるべきはデプロイに関する仕様、特にエンドポイントとモデルの対応関係、独自モデルの使用に関する仕様です。
AWSのデータ関連のサービスとしてはAmazon Kinesis Data Firehose、Amazon Kinesis Data Analytics、Amazon Kinesis Data Streams、Amazon Kinesis Video Streams、AWS Batch、AWS Glue、Amazon S3、Amazon Athena、Amazon QuickSight、Amazon EMR、AWS Data Pipeline、Amazon Redshift等のサービスが重要になります。
どういったデータソースに対して、どういったことをトリガーにして、どういった操作・加工ができるか、という観点から整理しておくのが良いでしょう。
(2020/1/3追記)下記の公式ドキュメントに「Analytics」系サービスとしてリストアップされていました。
学習開始前のスペック
ここからは自分の話。
業務でのAWS使用歴は3〜4年程度ですが、機械学習に関しては完全な初心者です。
スコア
合格点が750点のところ、870点での合格でした。
試験中は6割くらいしか自信を持って答えられていない感覚でしたが、終わってみれば余裕の合格でした。
自信がなくても最後まであきらめないでがんばりましょう。
準備期間
6ヶ月程度です。
ただしこの間ひたすら試験を意識して学習していたわけではありません。
MLSの試験を意識した学習は2ヶ月ほどだと思います。
もう少し細かく言うと最初の1ヶ月は全く別のG検定という機械学習に関する基礎知識の試験の学習をしていました。
後述しますが、G検定は機械学習の基礎知識習得にかなり役立ちました。
G検定学習後の3ヶ月は特に明確な学習をしていたわけではありませんが、機械学習の基礎知識が身についたので、ちょこちょこと気ままにQiitaで機械学習に関する記事を読んだりしていました。
最後にMLSを受験すると決めてからの2ヶ月は集中してMLSに受かるための学習に取り組んできました。
役に立った教材・情報
役に立った教材・情報を紹介していきます。
公式情報
サンプル問題の難易度は実際の問題にかなり近いと感じます。
同じ問題は出ないので最初に雰囲気を掴んだら一旦忘れて、ある程度学習を進めた後に自分の知識のレベルを測るために再度見るのがおすすめの使い方です。
Black Belt
なにはともあれBlack Beltの動画視聴がおすすめです。
上述したサービス別資料にあるリンクのうち、Amazon SageMakerの2回分はぜひYouTubeで見ましょう。
逆にその他はどういったことができるかの概要がきっちり抑えられていれば良いかなというレベルです。
余談ですが、Black Beltって様々な方がすすめている割に意外とYouTubeの視聴回数が少ないように思います。
意外とすすめている方も見ていなったかり、すすめられている側の方も見ていなかったりするものなんですかね。
MLSの学習を通じて、MLSと直接関係ない回も見るようになって思うのは、動画で見るというのは気軽に概要を掴むのに最高ということです。
人によるとは思いますが、スライドを見るだけで動画で見たことないという人は一度見てみると意外とハマるかもしれません。
公式Eラーニング
公式で提供されているトレーニングです。
無料で受けられます。
さらっと機械学習の基礎を学べるというメリットもありますが、それよりも最後まで進めると受けられる模擬試験形式の問題が非常に役立ちました。
本番の試験の難易度に近く、問題数も43問でボリュームも多く、問題の傾向を理解するのにも役立ちます。
この公式のExam ReadinessのEラーニングはあまり受験者に認知されていない気がするのですが、かなり良い内容になっていました。
公式模擬試験
認定サイトから申し込める有料(4000円)の模擬試験も役立ちました。
別の試験に合格していると、合格特典で無料受験ができます。
こちらも本番の試験の難易度に近いと思います。
ただし、問題数は少ないので、これにお金を払うなら先に公式のEラーニングをきっちりやる方が効果的です。
合格体験記
あまりたくさん読んでも仕方ないです。活用したのはこちら。
合格のためのキーワードを挙げてくれています。ある程度学習を進めたのちに再訪して、こちらに書かれているキーワードが概ね理解できていれば学習は順調に進んでいると言えると思います。
こちらもキーワードで学習の進み具合を確認するために有用でした。
自分の実感とは少し違いましたが、様々な合格体験記に記載されている内容の比重をまとめてくれているのは助かりました。
Tipsが具体的でかなり役立つので一読をおすすめします。
G検定の教科書
機械学習に関する基礎知識は必要ですが、これを学べばよいという銀の弾丸はありません。
個人的にはG検定の学習が機械学習の基礎知識習得に役立ったので、G検定の教科書をおすすめしておきます。
私は別の問題集を使いましたが、一番評判の良さそうな書籍のリンクを貼っておきます。
G検定なんて回り道はしたくないという方が一直線に基礎を学ぶにはSageMakerのドキュメントから基礎の部分を拾っていくか、合格体験記で挙げた記事のキーワードを基に一つひとつの要素を掘り下げていくのが良いと思います。
(2020/1/11追記)読んでもいない書籍をおすすめするのもおかしい気がしてきたので、実際にG検定の学習時に読んだ書籍も紹介しておきます。無難な選択肢の一つです。
その他雑感
事前に各所で見聞きしていたよりもSageMakerに関する問題は出ませんでした。特にビルトインアルゴリズムについてはほとんど問われませんでした。
ソリューションを問う問題で迷ったらマネージドサービスを使用するソリューションを選ぶというのはかなり有効なTipsかなと思います。
本記事がMLS合格の一助になれば幸いです。
コメント