卷積神經網路CNN:卷積的來源和原理
卷積神經網路(Convolutional Neural Network,簡稱為CNN或ConvNet)
是一種具有
區域性連線、權值共享
等特點的深層前饋神經網路,在影象和影片分析領域中,比如
影象分類、目標檢測、影象分割
等各種視覺任務中都有顯著的提升效果,是目前應用最廣泛的模型之一。
卷積
和
池化
是卷積神經網路中的兩個核心操作,很多卷積神經網路的結構都是將這兩者進行組合而得到的。
今天我們來闡述一下卷積的來源和原理。
卷積一詞來源於訊號處理領域,它是一項廣泛應用於訊號處理、影象處理以及其他工程科學領域的技術。其最典型的應用場景是:
針對某個線性時不變的系統,給定輸入訊號和系統響應,來求系統的輸出
。
在傳統的影象處理中,計算機中的影象通常都是按照畫素點以離散的形式儲存的,可以用一個二維或者三維的矩陣來表示,卷積核通常是人為定義的,不同的卷積核可以提取輸入資料中的某種特徵,從而得到不同的輸出,也就是說,
不同的卷積核是可以提取不一樣的特徵。
在訊號處理中,卷積有一個應用非常廣泛、有著舉足輕重地位的定理——
卷積定理
。
它的意義在於可以將時域中複雜的卷積運算轉換為頻域中簡單的相乘運算。
要理解卷積定理,還需要先知道傅立葉變換。
傅立葉變換是將時域中的資料轉化到頻域中的一種方法,它將函式分解為一系列不同頻率的三角函式的疊加,可以將它理解為從另一個維度去觀察資料的方法。
將影象和卷積核都變換到頻域中,變換後,卷積核可以看作是一個濾波器,對變換後頻域後的影象進行處理,當卷積核對應的濾波器是一個低通濾波器時,進行影象處理時會過濾掉一些較高的頻率,再將頻域影象轉換為畫素,我們會發現影象會丟失一些細節,這是因為頻域中的高頻部分對應著圖片中的劇烈變化區域,也就是影象的邊緣細節。
好了,今天的內容就先到這裡啦,
下次內容主要是——深度學習中的卷積操作。
碼字不易,歡迎
點贊、關注+收藏