在學(xué)習(xí)期間調(diào)整生成器的權(quán)重,目標(biāo)是使生成的圖像與該類的真實圖像盡可能相似,以至于判別器無法區(qū)分出來。
以下是最大的GAN(https://arxiv.org/abs/1809.11096)生成的圖像示例。
關(guān)于GAN在keras上的實現(xiàn),請參閱: https://github.com/eriklindernoren/Keras-GAN
??計算機視覺所需硬件
要訓(xùn)練大型模型,需要用到大量資源。實現(xiàn)這一目標(biāo)有兩種方法。首先是使用云服務(wù),比如google cloud或者aws。第二種方法是自己組裝一臺帶有GPU的計算機。
只需1000美元,就可以組裝一臺相當(dāng)好的機器來訓(xùn)練深度學(xué)習(xí)模型。
更多細(xì)節(jié)請參閱:?https://hypraptive.github.io/2017/02/13/dl-computer-build.html
計算機視覺的用戶界面
ownphotos的face儀表盤
Ownphotos?是一個令人驚嘆的用戶界面,允許您導(dǎo)入照片并自動計算臉部嵌入,進(jìn)行目標(biāo)識別和人臉識別。
它用到的算法:
人臉識別:face_recognition目標(biāo)檢測:densecap,?places365
應(yīng)用
計算機視覺有很多應(yīng)用:
個人圖片整理自動駕駛汽車自動無人機驗證碼識別/OCR過濾網(wǎng)站/應(yīng)用程序上的圖片自動標(biāo)記應(yīng)用程序的圖片從視頻(電視節(jié)目,電影)中提取信息視覺問答:結(jié)合自然語言處理和計算機視覺藝術(shù):生成式對抗網(wǎng)絡(luò)
??結(jié)論
正如我們這里所見,上述視覺領(lǐng)域各方面的實現(xiàn)中誕生了許多新的有趣的方法和應(yīng)用。
我認(rèn)為人工智能最有趣的,在各領(lǐng)域尤其在視覺領(lǐng)域中,是學(xué)習(xí)可再使用的算法。讓這些方法適用于處理越來越多的任務(wù)而不需要更多算力資源和數(shù)據(jù) :
遷移學(xué)習(xí) : 使快速重新訓(xùn)練預(yù)處理了的大型神經(jīng)網(wǎng)絡(luò)成為可能嵌入 (例如facenet)?: 使識別許多類而無需對這些類進(jìn)行訓(xùn)練成為可能