リバーシAIを作って学ぶ深層強化学習
- ¥ 700
リバーシ(オセロ)を深層強化学習(DQN)で学習する方法を紹介します。 強化学習(主にQ学習)の基本から解説しています。 GPUでの効率的な実装方法についても解説しています。 作成したコードは、Google ColabのJupyter Notebookで実行できます。 作成したAIと対局することもできます。
目次
はじめに 第1章 導入 1.1. 本書の目的 1.2. 前提知識 1.3. 実行環境 1.4. お勧め書籍 第2章 リバーシライブラリ 2.1. creveresi 2.2. インストール方法 2.3. インターフェースの説明 第3章 強化学習入門 3.1. 強化学習の概要 3.2. Q学習 第4章 DQN入門 4.1. DQNの解説 4.2. PyTorchのDQNチュートリアル 4.3. ソースの解説 第5章 リバーシのDQN実装 5.1. チュートリアルとの相違点 5.2. リバーシのニューラルネットワーク 5.3. 実装 5.4. 結果 5.5. 対局 第6章 並列実装 6.1. 実装 6.2. 結果 6.3. 対局 おわりに