您的位置：首頁(yè) > 新聞 > 高新技術(shù) > 新聞詳情

英偉達(dá)最新黑科技：根據(jù)文本生成圖片

時(shí)間：2021-11-26 14:56:21

來(lái)源：DTF
作者：3DM編譯
編輯：方形的圓

Nvidia在2019年GTC大會(huì)的時(shí)候，披露生成對(duì)抗網(wǎng)絡(luò)GauGAN能夠?qū)⒂脩艉?jiǎn)單的草圖，轉(zhuǎn)換成為驚人的風(fēng)景畫(huà)，而其今日公布GauGAN2更加驚人，可根據(jù)用戶輸入的文本生成對(duì)應(yīng)圖像，例如讓用戶輸入“sunset at a beach”等短語(yǔ)，人工智能就會(huì)即時(shí)生成場(chǎng)景圖畫(huà)，只要用戶額外增加形容詞，像是“sunset at a rocky beach”，或是將sunset改成afternoon或是rainy day，模型就會(huì)立刻修改圖片。

演示視頻：

官方解釋，GauGAN2在單個(gè)模型中，結(jié)合了分割映射、圖像修復(fù)和文本到圖像生成功能，使其能夠根據(jù)文本和手繪，來(lái)創(chuàng)建逼真的藝術(shù)，而且這個(gè)最新發(fā)布的范例展示，是第一個(gè)在單個(gè)對(duì)抗網(wǎng)絡(luò)框架中，結(jié)合文本、語(yǔ)義分割、草稿圖和樣式等多個(gè)模式，這樣的方法讓藝術(shù)家，能夠以更豐富的方法，指引人工智能快速生成圖像。

用戶不需要描繪或是想象場(chǎng)景中的每個(gè)元素，只要輸入簡(jiǎn)單的短語(yǔ)，模型就能夠快速生成圖像，并且符合短語(yǔ)的關(guān)鍵特征和主題，用戶可以另外使用手繪圖，來(lái)自定義景物，像是讓山更高，或是前景添加幾棵樹(shù)，甚至是天空多一些云彩。

用戶利用GauGAN2搭建圖是一個(gè)迭代的過(guò)程，在文本框中輸入的每個(gè)單詞，都會(huì)讓人工智能在圖像中添加更多的內(nèi)容，Nvidia提到，GauGAN2背后所使用的人工智能模型，應(yīng)用了Nvidia Selene超級(jí)計(jì)算機(jī)，并且使用1,000萬(wàn)張高品質(zhì)風(fēng)景圖進(jìn)行訓(xùn)練，研究人員利用神經(jīng)網(wǎng)絡(luò)的特性，讓人工智能學(xué)習(xí)單詞和視覺(jué)效果間的關(guān)聯(lián)，像是冬天、霧或是彩虹等。