思考ノイズ

無い知恵を絞りだす。無理はしない。

Pythonと機械学習の学習について地盤固めのロードマップ <具体的なプラン編>

bython-chogo.hatenablog.com

実際に以下の順番で進めていこうかと思ってます。ただまだ実際に自分の目的にあっている内容なのか不明確なものもあるのでそこは柔軟に変更していくつもりです。 特に、後半はデータ基盤エンジニアに適切な内容とのことで、そこが自分の進みたい方向性なのか、もう少し時間をかけて吟味してみたいです。 目標は5か月。来年の3月までには一通りこなしていければと考えています。

エンジニアリングの基礎

まずはPythonを手段とした機械学習のためのエンジニアリングの知識やスキル地盤固め

独学プログラマー Python言語の基本から仕事のやり方まで

独学プログラマー Python言語の基本から仕事のやり方まで

もうすでに通読しました。エントリ上げる予定

機械学習に食わせるデータの前処理をまとめた本と理解してますが、RとSQLも入ってくるので、そこをどこまで掘り下げるかは方向性を決めたいです。

前々から興味があった本。プログラムはプログラマーのものではなく、オフィスワーカーが当たり前のようにつかえるようになれば、生産性は確実に向上するとは前々から考えていましたので、この視点の本はよいと思いました。

機械学習理論の基礎

この手の本はすでにたくさん持っているので、どこまで追加して買う必要があるのかとは思うのですが、あまりブレずに道に乗ってすすんだほうがよさげかなと考えています。

見て試してわかる機械学習アルゴリズムの仕組み 機械学習図鑑

見て試してわかる機械学習アルゴリズムの仕組み 機械学習図鑑

現場で使える! Python機械学習入門 機械学習アルゴリズムの理論と実践 (AI & TECHNOLOGY)

現場で使える! Python機械学習入門 機械学習アルゴリズムの理論と実践 (AI & TECHNOLOGY)

実務系

機械学習のための特徴量エンジニアリング ―その原理とPythonによる実践 (オライリー・ジャパン)

機械学習のための特徴量エンジニアリング ―その原理とPythonによる実践 (オライリー・ジャパン)

これ、興味あるんです。特徴量をどこから引っ張ってくるのか、ロウデータからどこに目をつけるべきなのか。

データ基盤エンジニアリング

このあたりはやるべきか再検討はしようかと考えています。正直タイトルのワードがなんたるかもよくわかっていないというのが正直なところとなります。

データ指向アプリケーションデザイン ―信頼性、拡張性、保守性の高い分散システム設計の原理

データ指向アプリケーションデザイン ―信頼性、拡張性、保守性の高い分散システム設計の原理

SRE サイトリライアビリティエンジニアリング ―Googleの信頼性を支えるエンジニアリングチーム

SRE サイトリライアビリティエンジニアリング ―Googleの信頼性を支えるエンジニアリングチーム

入門 監視 ―モダンなモニタリングのためのデザインパターン

入門 監視 ―モダンなモニタリングのためのデザインパターン

入門 PySpark ―PythonとJupyterで活用するSpark 2エコシステム

入門 PySpark ―PythonとJupyterで活用するSpark 2エコシステム