在6月1日舉辦的2021北京智源大會上,一位虛擬學生“華智冰”的亮相引發(fā)了汽車軟板廠的關注。作為一個誕生沒多久,甚至未曾參加過高考的學生,華智冰就已經被清華大學破格“錄取”。這一虛擬學生究竟有何能耐,對人工智能領域的發(fā)展又意味著什么呢?
琴棋書畫,樣樣精通
在智源大會上現場播放的視頻中,華智冰展示了自己創(chuàng)作的音樂、詩詞和繪畫作品。華智冰由北京智源人工研究院、智譜AI和小冰公司三方合作開發(fā),以智源人工智能研究院的“悟道2.0”為核心模型,并由小冰公司提供框架,并負責聲音和形象的開發(fā)。
“悟道2.0”是北京智源人工智能研究院發(fā)布的超大規(guī)模智能模型,其參數規(guī)模達到1.75萬億,這個數字是OpenAI打造的GPT-3的三倍,此前的紀錄保持者為Google Switch Transformer,這是目前全球最大也是中國首個萬億級的智能模型。
華智冰的聲音與形象歸功于小冰公司,但其展示的詩詞書畫等作品卻是由“悟道2.0”來打造的。國際上主流的大模型基本都基于英文的語料進行開發(fā),而“悟道2.0”模型擁有4.9TB的中英訓練數據庫WuDaoCorpora2.0,包含了中英文本數據和中文圖文數據。
清華大學教授、智源研究院學術副院長,同時也是華智冰在清華的導師唐杰表示:“華智冰是數據與知識雙輪驅動的人工智能,其學習能力主要在于從數據中抽取知識,機器可以處理數據,從而實現可持續(xù)學習。”
據汽車軟板廠了解,目前華智冰基于“悟道”的文源和文瀾兩大模型已經實現了上述的詩詞創(chuàng)作,未來會繼續(xù)往認知層面發(fā)展,在清華大學計算機系知識工程實驗室“進修”之后,掌握編程等其他技能。
為虛擬AI形象注入生命
目前AI形象已經開始在多個領域浮現,比如虛擬歌手和虛擬畫家等。小冰公司是去年微軟小冰業(yè)務拆分出來的獨立運營公司,“悟道”的存在為華智冰賦予了自然語言處理能力,而小冰框架則為其賦予了交互和語音能力。
就拿小冰旗下的X Studio歌手軟件來說,小冰框架以及為其打造了多名虛擬歌手,每位歌手都具備不同的音色和音域,而近期發(fā)布的X Studio 1.7.0中,華智冰也正式入籍,解鎖了演唱技能。
之所以華智冰能夠“入學”清華,不單單是因為其專業(yè)技能,也是因為華智冰會與清華的師生產生交互,并與其建立更好的師生同學關系,加強其情感交互能力。這種情感交互和對話推理能力,和AI少女小冰類似,也是源于小冰框架。
“悟道2.0”這種大模型和訓練數據是搭建一個AI平臺的基石,但訓練成本也相當高。比如獨家授權給微軟的GPT-3就要用上1萬片GPU,而智源人工智能研究院的介紹中也提到了這一點,華智冰所需的GPU比任何一個清華學生都要多。
華智冰擁有的才藝和創(chuàng)作能力需要龐大的訓練數據支撐,但僅靠這部分數據產生的交互能力依然是有所欠缺的,因此華智冰在清華的校園生涯也是一個必要的學習過程。汽車軟板廠認為,AI裁判和AI主播等,未來還會出現更多的AI主體在我們的生活中充當不同的形象。