“升級后的騰訊混元中文效果整體超過GPT3.5”。

騰訊混元大模型接入180個(gè)內(nèi)部業(yè)務(wù),正式開放“文生圖”功能

2023-10-27 17:25:00發(fā)布     來源:多知網(wǎng)    作者:Penny  

  多知網(wǎng)10月27日消息,騰訊混元大模型10月26日全新升級,正式對外開放“文生圖”功能。騰訊表示,升級后的騰訊混元中文效果整體超過GPT3.5,代碼能力大幅提升20%。

  相比其他大模型,騰訊混元的文生圖應(yīng)用著力于人像真實(shí)感、場景真實(shí)感,同時(shí),在中國風(fēng)景、動(dòng)漫游戲等場景等生成上有優(yōu)勢。

  騰訊數(shù)據(jù)顯示,騰訊混元文生圖能力,目前已經(jīng)被用于素材創(chuàng)作,商品合成,游戲出圖等多項(xiàng)業(yè)務(wù)中,此外在廣告業(yè)務(wù)下的多輪測評中,騰訊混元文生圖的案例優(yōu)秀率和廣告主采納率分別達(dá)到86%和26%。

  過去一個(gè)月,騰訊混元大模型不僅各項(xiàng)能力均有升級,代碼、數(shù)學(xué)能力也大幅提升。

  經(jīng)過對32種主流語言代碼文件、各類計(jì)算機(jī)書籍和博客的學(xué)習(xí)增訓(xùn),騰訊混元代碼處理水平提升超過20%,代碼處理效果勝出ChatGPT 6.34%,在HumanEval公開測試集指標(biāo)上全面超過Starcoder、Codellama等業(yè)界頭部開源代碼大模型。

  只需輸入簡單的指令如“幫我用前端語言實(shí)現(xiàn)一個(gè)貪吃蛇”,騰訊混元便能自動(dòng)生成可運(yùn)行的代碼,快速制作出一個(gè)貪吃蛇小游戲。此外,騰訊混元還支持Python、C++、Java、Javascript等多種語言的指令生成,比如輸入“用Python畫紅色的心形線”,騰訊混元會(huì)提供代碼庫選擇、安裝命令、繪制代碼等具體操作步驟的指引。

  騰訊內(nèi)部目前已經(jīng)有多個(gè)開發(fā)平臺接入了騰訊混元大模型,工程師們可以使用騰訊混元來進(jìn)行代碼生成、代碼補(bǔ)全、代碼漏洞檢測和修復(fù)、表格數(shù)據(jù)處理、數(shù)據(jù)庫查詢等工作。

  比如,在IDE編程場景中,騰訊工蜂Copilot通過接入混元大模型,可根據(jù)注釋生成對應(yīng)代碼,或基于上下文智能補(bǔ)全代碼,提高了編程效率。混元大模型還可以幫助用戶進(jìn)行代碼漏洞檢測和修復(fù),保障軟件開發(fā)過程中的安全性。

  目前,超過180個(gè)騰訊內(nèi)部業(yè)務(wù)已接入騰訊混元,包括騰訊會(huì)議、騰訊文檔、企業(yè)微信、騰訊廣告和微信搜一搜等。服務(wù)公司外部零售、教育、金融、醫(yī)療、傳媒、交通、政務(wù)等多個(gè)行業(yè)客戶。

  據(jù)騰訊介紹,大模型文生圖的難點(diǎn)體現(xiàn)在對提示詞的語義理解,生成內(nèi)容的合理性以及生成圖片的效果,針對這三個(gè)技術(shù)難點(diǎn),騰訊進(jìn)行了專項(xiàng)的技術(shù)研究,提出了一系列原創(chuàng)算法,來保證生成圖片的可用性和畫質(zhì)。

  1、在語義理解方面,騰訊混元采用了中英文雙語細(xì)粒度的模型,模型同時(shí)建模中英文實(shí)現(xiàn)雙語理解,而不是通過翻譯,通過優(yōu)化算法提升了模型對細(xì)節(jié)的感知能力與生成效果,有效避免多文化差異下的理解錯(cuò)誤。

  2、在內(nèi)容合理性方面,AI生成人體結(jié)構(gòu)和手部經(jīng)常容易變形。混元文生圖通過增強(qiáng)算法模型的圖像二維空間位置感知能力,并講人體骨架和人手結(jié)構(gòu)等先驗(yàn)信息引入到生成過程中,讓生成的圖像結(jié)構(gòu)更合理,減少錯(cuò)誤率。

  3、在畫面質(zhì)感方面,混元文生圖基于多模型融合的方法,提升生成質(zhì)感。經(jīng)過模型算法的優(yōu)化之后,混元文生圖的人像模型,包含發(fā)絲、皺紋等細(xì)節(jié)的效果提升了30%,場景模型,包含草木、波紋等細(xì)節(jié)的效果提升了25%。

  在圖像生成上,騰訊還給出了prompt,比如你想生成一張更接近真人感的照片,或接近實(shí)拍的圖片。請使用“生成一張XX的圖片”或者“生成一張XX的照片”,并加上“真實(shí)感”或“攝影風(fēng)”等描述效果會(huì)更好。

  如果想要特定風(fēng)格的圖片,建議在提示詞中加入該風(fēng)格的描述,如油畫風(fēng)、賽博朋克風(fēng)、水墨畫風(fēng)格、像素風(fēng)、日漫動(dòng)畫風(fēng)、兒童畫等,或者使用靈感發(fā)現(xiàn)中的特定風(fēng)格,這樣會(huì)更接近需求。

  如果想要的畫面進(jìn)行盡可能詳細(xì)的描述,并建議多次調(diào)整你的提示詞,比如“生成一副照片:亞洲女子,魅力,長發(fā),戴墨鏡,站在長城上,背景有紅葉”、“畫一幅亞洲女生的畫,黑色與綠色相間的中短發(fā),卡通人像,迪士尼風(fēng),民俗肖像,寧靜臉孔”。

  騰訊混元生成圖片的部分案例:

  1)真實(shí)感人像

  生成可愛的亞洲 4 歲女孩穿著棉質(zhì)連衣裙,大眼睛,古代中國,攝影風(fēng)格,漢服

  1.png

  2)平面場景

  畫一幅畫:小企鵝在樹下行走,突然一個(gè)蘋果從樹上掉下

2.png

  03)3D氛圍感場景

  生成一張賽博朋克風(fēng)格的圖片:一只立體的貓穿著賽博朋克風(fēng)的衣服,周圍是燈紅酒綠的城市場景,潮濕的地面上反映了城市的倒影

3.png

  04)古詩詞

  幫我生成一張圖片:空山新雨后,天氣晚來秋,水墨風(fēng)格

4.png