自動(dòng)編碼器的一個(gè)典型應(yīng)用是特征降維,和PCA的作用一樣,但是比PCA的性能更強(qiáng)。
可回以想這樣答一個(gè)場(chǎng)景:我們要訓(xùn)練一個(gè)CNN模型,這個(gè)模型最終可以識(shí)別貓、狗、船等,那么我們需要給它喂入大量的貓狗等圖像,假如這些圖像都是高清的,即數(shù)據(jù)維度很大,那么CNN訓(xùn)練的時(shí)間就會(huì)變長(zhǎng)。這時(shí)候需要將圖片壓縮一下,我們當(dāng)然可以考慮使用圖像壓縮算法,這里只是舉一個(gè)例子,如果某些數(shù)據(jù)集不是圖片,如何壓縮呢?
答案可以使用自編碼器,自編碼器可以將高維的數(shù)據(jù)特征用一個(gè)低維的特征來(lái)表示,
自動(dòng)編碼器的作用是通過(guò)編碼器只學(xué)習(xí)其典型特征(維度降低了),該特征通過(guò)解碼器可以大致復(fù)原原來(lái)的數(shù)據(jù)即可。這樣再將這個(gè)學(xué)習(xí)到的低維特征輸入到相應(yīng)的神經(jīng)網(wǎng)絡(luò)中,可以大大減少訓(xùn)練的時(shí)間。在實(shí)際應(yīng)用中,我們訓(xùn)練好自動(dòng)編碼器后,一般只使用其編碼器部分,從而獲得低維的數(shù)據(jù)。再將這個(gè)數(shù)據(jù)輸入到其它分類(lèi)模型中進(jìn)行訓(xùn)練。