『Python機械学習プログラミング』を読む。第1章、第2章
Raschkaの「Python機械学習プログラミング」の日本語版が出たので読んでいきます。
Python機械学習プログラミング 達人データサイエンティストによる理論と実践 (impress top gear)
第1章「データ から 学習 する 能力」 を コンピュータ に 与える
概要でした。
教師あり、教師なし、強化学習の軽い説明と前処理やPythonの話でした。
網羅的な本で強化学習の説明をしている本を初めて見た気がします。多くの場合は「ただし強化学習は除く」と注釈がついているもんですよね。
第2章「データ から 学習 する 能力」 を コンピュータ に 与える
パーセプトロン、adalineの説明とPythonでの実装でした。
irisという花の分類を例にやりました。
データはcsvがurlをたたいて取得できるようになっているのでデータの取得で困ることや面倒になることはなかったです。
データの扱いは基本的にnumpyとpandasでやります。pandasのdataframeの扱いなどはPythonでデータサイエンスやる際に必須となっているのでいいですね。
理論の説明は簡潔で分かりやすいです。数式がしっかり書いているので線形代数・微積分程度の知識は必要かもしれません。また、数式とコードの対応がわかるようにコード中に数式のコメントがあるのも良かったです。
本全体を通して可視化にこだわっているので、pyplotの扱いに慣れるのにはちょうどいい感じもあります。
サンプルコードをjupyterで実行したものをgithubに上げています。
見ればどんな感じの内容かわかると思います。
まとめ
教育的に書かれているので独りでも読めますし、勉強会などの教材にぴったりかもしれません。
続きも読んでいきます。