Name: 直感的に理解する Transformer への CNN の導入
Brand: hello-stats
Availability: InStock

技術書典16

hello-stats

直感的に理解する Transformer への CNN の導入

電子版
Digital
1,500 JPY
電子版＋物理版
Ships within 7 days
Out of Stock
Physical (direct)
1,500 JPY
Request Restock Notice Mail
Unrequest Restock Notice Mail

About Gift

2020 年に発表された ViT(Vision Transformer) はそれまで畳み込みニューラルネットワーク (CNN; Convolutional Neural Network) が支配的であった Computer Vision 分野における DeepLearning に新たなトレンドをもたらしました。しかしながら、必要な学習データが多い・計算効率があまりよくないなどの課題がありました。そこでそれらの課題の解決を図るために、階層型 ViT の研究が 2021 年頃に多く発表されました。本書では階層型 ViT の中でも Convolutional vision Transformer で導入された「Transformer への CNN の導入」をメインテーマに詳しく取りまとめました。