技術書典6で頒布したMLOps(Concourse/Argo Workflow)を題材にした技術同人誌です。 この本は、筆者が3年間ひとりで取り組んできた「MLOps」としての活動記録です。 筆者は、2015年にTensorFlowがオープンソースになった時「自分好みの眼鏡っ娘画像を自動的に収集したい」という一心で、眼鏡っ娘画像の自動収集・判定システム「MeganeCo」の構築をはじめました。 今回は、複雑化してきた機械学習モデル作成のワークフローを自動化する取り組みについて解説しています。
MLOpsとは
MLOps(Machine Learning Operations)は、近年、機械学習の勉強会などで話題に上るようになった新しい言葉で、明確な定義は未だありません。 本書では、モデルの構造やハイパーパラメーターなど、いわば「機械学習の花形」のみならず、データの収集、蓄積、整理、モデルの学習や評価を円滑に行うための様々な施策。 それらの施策を立案、実行する個人やチームまでを含めて「MLOps」と呼んでいます。
前提知識
本書は、機械学習システムを構築しようとしている方が手に取ることを想定して執筆しています。 機械学習の経験があることが理想ですが、機械学習をまったく知らないけれど機械学習システムの構築に必要な要素を知りたい。 雰囲気を知りたいという人の参考になることも目標としています。
目次
第1章 システム構成 データセット管理 GPUサーバー MeganeCo Playground 第2章 機械学習ワークフローと課題 データセットをメンテナンスする 学習データへ変換する 単体モデルを作成する 統合モデルを作成する モデルを変換する モデルをデプロイする 課題と理想 第3章 機械学習ワークフローを自動化する(Concourse編) 第4章 機械学習ワークフローを自動化する(Argo Workflow編) Argo Workflowとは Kubernetesのセットアップ Argoのセットアップ Volumeの準備 ワークフローの定義と実行 今後の課題