機械学習の炊いたん8。
- 1,000 JPY
「機械学習の炊いたん」シリーズは、仕事で趣味でAI、データサイエンスに関わる5人がお送りする、すぐに「機械学習やデータ分析を遊ぶ、知る、使う」レシピが揃った合同本です。技術書典6から参加し、ついに8作目となりました。 今回のおしながきは: 1. 機械学習モデルの運用:分布変化に立ち向かうための方法 2. 理論戦記 (Theory of the Lasso) 3. Rust + candleでお手軽に大規模モデルを利用する 4. AIマップの良さと、一歩先への道標 5. Matrix Profileによる時系列モチーフ探索 (全102ページ) Cover design Shuichi Muranishi
機械学習モデルの運用:分布変化に立ち向かうための方法
kirikei氏の担当章。 機械学習モデルの活用といえば、実社会に予測や分類が既に多く応用されています。しかし、実社会の応用では、日々生成されるデータの変化に追随する運用が必要です。 本章では、データの分布変化のうち共変量シフトという変化に対して、機械学習モデルをどのように学習するか、そして手法のひとつであるRuLSIFを解説します。また、テストデータの分布が変化するようなデータに対してRuLSIFを適用し、通常の学習に比べてどれくらい精度が上がるかを比較します。
理論戦記 (Theory of the Lasso)
数理枠担当Tim氏の担当章。 過去作で扱ったテーマの中でも心惹かれ、かつ実際に関わることの多いスパース推定というテーマについて、その起源ともいえるLasso理論の立場から紐解くことを試みます。 本章では、Lassoに関する予測誤差とパラメータの推定後さを理論面から考察します。線形代数や確率統計の事前知識が望ましいものの、初学者向けに簡略化した説明のため、お気持ちベースで雰囲気や考え方にも触れていただける仕立てです。
Rust + candleでお手軽に大規模モデルを利用する
Rust枠担当? emergent氏の担当章。 ここ数作はRust x 機械学習というテーマを取り上げています。本章ではRustで使えるcandleという機械学習フレームワークを紹介します。 candleを用いて、Hugging Faceにある膨大なモデル群から、Whisperによる音声認識やStable Diffusionによる画像生成を試します。Rustを学習用途に使うのは難しいかもしれませんが、推論器としてはエッジも含むさまざまな環境での活用が考えられます。Rustを触るきっかけとしてもぜひご活用ください。
AIマップの良さと、一歩先への道標
tomo-makes氏の担当章。 人工知能学会のAIマップを取り上げました。AIマップは、AIの話を「ふわっ」と終わらせないために、とても良いツールです。その次に自分で進む時、手がかりが必要となるシーンもあるはず。AI課題マップ、AI技術マップのうち、特に課題マップを深掘りしました。6つのAI課題分類、28のAI課題カードに対して、各領域の次の一手を例示します。 なお、おまけとして『機械学習の炊いたん』シリーズ 8作品と、関連2作品を事前知識として与えた、カスタムChat GPTを作成しました。AIマップをきっかけに、過去の炊いたんシリーズにも触れていただけたら嬉しいです。
Matrix Profileによる時系列モチーフ探索
sonodano氏の担当章。 今回は、時系列データにおいて、類似系列のペアを高速で全列挙できるMatrix Profileを紹介します。 多くの長期時系列データには、それを特徴づける繰り返しパターンが現れます。これが発見できれば、現れにくいパターンを見て異常、または傾向が変化したと判断できます。ただ、愚直に計算すると時間がいくらあっても足りません。 近年流行りのDeep Learning系の異常検知手法と異なり、ユークリッド距離という理解しやすい形、かつ高速で指標を出せるMatrix Profileを深掘りしてみましょう。