您的位置：首頁(yè) > 新聞 > 高新技術(shù) > 新聞詳情

華為將推出盤古數(shù)字人大模型號(hào)稱“人人都將實(shí)現(xiàn)數(shù)字人自由”

時(shí)間：2023-07-28 17:08:14

來源：IT之家
作者：3DM整理
編輯：方形的圓

IT之家7月28日消息，在今日舉行的2023年華為云數(shù)字文娛AI創(chuàng)新峰會(huì)上，華為云全球Marketing與銷售服務(wù)總裁石冀琳表示，華為云將在后續(xù)推出盤古數(shù)字人大模型，可幫助用戶12小時(shí)完成數(shù)字人生成。同時(shí)，她還宣稱在人工智能的加持下，“每個(gè)人都有望實(shí)現(xiàn)‘?dāng)?shù)字人’自由”。

另?yè)?jù)華為云開發(fā)者聯(lián)盟介紹，盤古數(shù)字人通用大模型由華為云MetaStudio數(shù)字內(nèi)容生產(chǎn)線構(gòu)建而成。數(shù)字人基于華為云盤古基礎(chǔ)大模型能力、渲染引擎和實(shí)時(shí)音視頻能力，并使用PB級(jí)的音視頻數(shù)據(jù)進(jìn)行訓(xùn)練構(gòu)建。

盤古數(shù)字人大模型包含數(shù)字人形象、動(dòng)作、表情、口型、聲音等要素，官方號(hào)稱“每個(gè)用戶可以結(jié)合個(gè)人數(shù)據(jù)對(duì)數(shù)字人進(jìn)行訓(xùn)練”，構(gòu)建自己的數(shù)字人個(gè)性化大模型。數(shù)字人生成后，用戶通過文字、語(yǔ)音、視頻等方式生產(chǎn)驅(qū)動(dòng)向量信息，從而驅(qū)動(dòng)數(shù)字人生成高清視頻。

據(jù)稱，用戶可通過輸入文字（文本、Prompt文本），在10秒左右生成數(shù)字人模型；通過上傳照片，在30秒左右生成不同類型的數(shù)字人模型。

此外，用戶還可以通過拍攝一段5分鐘的視頻，在一個(gè)小時(shí)內(nèi)通過訓(xùn)練來生成數(shù)字人。官方表示，通過此手段生成的數(shù)字人，可保留用戶的個(gè)性化形象、表情、動(dòng)作、聲音和口型信息。生成數(shù)字人后，可以通過對(duì)話完成對(duì)數(shù)字人的二次編輯和背景融合，比如發(fā)型、配飾、服裝等。

據(jù)悉，盤古大模型3.0于2023年7月7日的2023年華為開發(fā)者大會(huì)上正式發(fā)布，可在礦山、鐵路、氣象、金融、代碼開發(fā)、數(shù)字內(nèi)容生成等領(lǐng)域發(fā)揮作用。