CNN vs Vision Transformer 強み弱み 比較解説

  Рет қаралды 1,193

ビジョンセンサーチャンネル

ビジョンセンサーチャンネル

3 ай бұрын

画像処理用のニューラルネットワークの2大アーキテクチャ、CNNとVisionTransformerを比較します。最近の技術についても紹介します。
どちらが強いかの判定もします(私の独断と偏見です。詳細内容の正しさはご容赦ください)
<出展>
・Masked Autoencoder:
 arxiv.org/abs/2111.06377
・Swin-Transformer:
 arxiv.org/abs/2103.14030
・CNNとVisionTransformerの融合(CoAtNet):
 arxiv.org/abs/2106.04803
・高速なVisionTransformer(EfficientViT):
 arxiv.org/abs/2205.14756
#ディープラーニング
#画像処理
#トランスフォーマー
#CNN
#transformer
#vit
#computervision
#deeplearning

Пікірлер: 1
@toyoo_cat
@toyoo_cat 2 ай бұрын
万能な単一技術はないので、うまい組み会わせがポイントになるのですね。
画像生成AIのしくみを直感的に解説 Stable Diffusion VAE  拡散モデル
12:17
ビジョンセンサーチャンネル
Рет қаралды 1,1 М.
Smart Sigma Kid #funny #sigma #comedy
00:40
CRAZY GREAPA
Рет қаралды 17 МЛН
Fast and Furious: New Zealand 🚗
00:29
How Ridiculous
Рет қаралды 42 МЛН
DEFINITELY NOT HAPPENING ON MY WATCH! 😒
00:12
Laro Benz
Рет қаралды 64 МЛН
【Transformerの基礎】Multi-Head Attentionの仕組み
37:47
トランスフォーマー(ViT)の中身 ~ Multi-Head Attentionを画像処理で解説 ~
8:56
ビジョンセンサーチャンネル
Рет қаралды 5 М.
GPTとは何か Transformerの視覚化 | Chapter 5, Deep Learning
26:36
3Blue1BrownJapan
Рет қаралды 132 М.
ディープラーニングによる異常検知(Anomaly Detection) AutoEncoder PatchCore
16:31
ビジョンセンサーチャンネル
Рет қаралды 2,9 М.
ゼロショット学習(基盤モデルCLIP)
10:34
ビジョンセンサーチャンネル
Рет қаралды 2,5 М.
【ソニー社内講演】拡散モデルと基盤モデル
14:30
nnabla ディープラーニングチャンネル
Рет қаралды 9 М.
Why Does Diffusion Work Better than Auto-Regression?
20:18
Algorithmic Simplicity
Рет қаралды 252 М.
İĞNE İLE TELEFON TEMİZLEMEK!🤯
0:17
Safak Novruz
Рет қаралды 1,1 МЛН