人工智能非常擅長(zhǎng)識(shí)別物體。在100萬(wàn)張照片中,它可以準(zhǔn)確指出哪張照片中有行人正在過(guò)馬路。然而,人工智能并不適合繪制一張圖片,顯示有行人正在過(guò)馬路。如果能做到這一點(diǎn),那么人工智能就能創(chuàng)造出非常逼真的模擬環(huán)境,讓無(wú)人駕駛汽車在這樣的模擬環(huán)境中訓(xùn)練。
問(wèn)題在于,創(chuàng)造新東西需要想象力,而想象力是人工智能所不擅長(zhǎng)的。
2014年,蒙特利爾大學(xué)博士生伊安·古德費(fèi)羅(Ian Goodfellow)在一家酒吧的學(xué)術(shù)辯論中首先想到了這個(gè)解決方案,這被稱作“生成對(duì)抗網(wǎng)絡(luò)”(GAN)。GAN讓兩個(gè)神經(jīng)網(wǎng)絡(luò)在數(shù)字版的“貓鼠游戲”中相互對(duì)抗。
兩個(gè)網(wǎng)絡(luò)都使用相同的數(shù)據(jù)集去訓(xùn)練。其中一個(gè)名為“生成器”,任務(wù)是利用所看到的圖像去創(chuàng)建不同版本,例如3只手的人。而另一個(gè)名為“鑒別器”,任務(wù)是識(shí)別所看到的圖像是否是生成器制造的假圖像。
通過(guò)這樣的過(guò)程,生成器將非常善于產(chǎn)生圖像,導(dǎo)致鑒別器無(wú)法判斷哪些是真實(shí)圖像,哪些是假的。從本質(zhì)上來(lái)看,生成器被訓(xùn)練去識(shí)別并制作看起來(lái)真實(shí)的圖像。
過(guò)去10年,GAN成為了人工智能最有前景的領(lǐng)域之一,幫助機(jī)器生成能迷惑人眼的結(jié)果。
GAN已被投入使用,用于制作聽起來(lái)很逼真的語(yǔ)音和圖像。例如,英偉達(dá)的研究者向GAN提供了大量明星照片,隨后創(chuàng)造出數(shù)百?gòu)埐⒉淮嬖诘念^像。另一個(gè)研究團(tuán)隊(duì)則生成了類似梵高作品的假畫。更進(jìn)一步,GAN可以以不同方式來(lái)重新想象畫面,例如將陽(yáng)光燦爛的道路變成一條雪路,或是將馬變成斑馬。
結(jié)果并不總是完美的:GAN或許會(huì)給自行車安上兩個(gè)車把,或是把眉毛放在頭像錯(cuò)誤的地方。不過(guò),由于生成的圖像和聲音往往非常真實(shí),因此專家認(rèn)為,從某種意義上來(lái)說(shuō),GAN已經(jīng)開始了解所看到和聽到的世界的底層結(jié)構(gòu)。這意味著除了想象力之外,人工智能還能獲得更獨(dú)立的能力,理解所見的世界。
官方微信
掃一掃