讓我們看一下paper中給出的結構圖:帶殘差的結構示意圖,圖片來自原論文首先,上一級的輸出是經過的,是恆正的輸出,而BN後的殘差連線,將使得maximum的feature部分更“Peaky”,恆正,這也導致最小值很可能永遠是0,或逼近0,而...