英偉達(dá)最新黑科技:根據(jù)文本生成圖片
- 來(lái)源:DTF
- 作者:3DM編譯
- 編輯:方形的圓
Nvidia在2019年GTC大會(huì)的時(shí)候,披露生成對(duì)抗網(wǎng)絡(luò)GauGAN能夠?qū)⒂脩艉?jiǎn)單的草圖,轉(zhuǎn)換成為驚人的風(fēng)景畫(huà),而其今日公布GauGAN2更加驚人,可根據(jù)用戶輸入的文本生成對(duì)應(yīng)圖像,例如讓用戶輸入“sunset at a beach”等短語(yǔ),人工智能就會(huì)即時(shí)生成場(chǎng)景圖畫(huà),只要用戶額外增加形容詞,像是“sunset at a rocky beach”,或是將sunset改成afternoon或是rainy day,模型就會(huì)立刻修改圖片。
演示視頻:
官方解釋,GauGAN2在單個(gè)模型中,結(jié)合了分割映射、圖像修復(fù)和文本到圖像生成功能,使其能夠根據(jù)文本和手繪,來(lái)創(chuàng)建逼真的藝術(shù),而且這個(gè)最新發(fā)布的范例展示,是第一個(gè)在單個(gè)對(duì)抗網(wǎng)絡(luò)框架中,結(jié)合文本、語(yǔ)義分割、草稿圖和樣式等多個(gè)模式,這樣的方法讓藝術(shù)家,能夠以更豐富的方法,指引人工智能快速生成圖像。
用戶不需要描繪或是想象場(chǎng)景中的每個(gè)元素,只要輸入簡(jiǎn)單的短語(yǔ),模型就能夠快速生成圖像,并且符合短語(yǔ)的關(guān)鍵特征和主題,用戶可以另外使用手繪圖,來(lái)自定義景物,像是讓山更高,或是前景添加幾棵樹(shù),甚至是天空多一些云彩。
用戶利用GauGAN2搭建圖是一個(gè)迭代的過(guò)程,在文本框中輸入的每個(gè)單詞,都會(huì)讓人工智能在圖像中添加更多的內(nèi)容,Nvidia提到,GauGAN2背后所使用的人工智能模型,應(yīng)用了Nvidia Selene超級(jí)計(jì)算機(jī),并且使用1,000萬(wàn)張高品質(zhì)風(fēng)景圖進(jìn)行訓(xùn)練,研究人員利用神經(jīng)網(wǎng)絡(luò)的特性,讓人工智能學(xué)習(xí)單詞和視覺(jué)效果間的關(guān)聯(lián),像是冬天、霧或是彩虹等。

玩家點(diǎn)評(píng) (0人參與,0條評(píng)論)
熱門(mén)評(píng)論
全部評(píng)論