“在AI時代,學生擁有AI導師,教師擁有AI助教。”

清華、北大、浙大、哈佛……全球高校花式擁抱AIGC

2023-08-28 18:48:43發(fā)布     來源:多知網(wǎng)    作者:王上  

  來源|多知網(wǎng)

  作者|王上

  圖片來源|Pexels

  自ChatGPT橫空出世之后,生成式AI技術已經(jīng)席卷到高校。

  近日,清華大學聯(lián)手字節(jié)跳動推出全新開源大語言模型SALMONN,可支持語音、音頻以及音樂輸入。

  8月22日,浙江大學宣布推出多個垂直大模型,包括「智海-三樂」教育垂直大模型、「智海-金磐」垂直金融零售語言大模型等。

  據(jù)多知網(wǎng)不完全統(tǒng)計,在國內,清華大學、北京大學、北京語言大學、上海交通大學、西北工業(yè)大學(或聯(lián)合企業(yè))推出了大模型,而在國外,哈佛大學的一門編程課程也推出了自研大模型,密歇根大學推出了新的AI平臺。

  “未來已來”不再是一句暢想,正如可汗學院創(chuàng)始人Sal Khan所預見的那樣,“在AI時代,學生擁有AI導師,教師擁有AI助教。”

WechatIMG65.png

  

  01

  國內高校“百模齊放”

  當前,高校大有“百模齊放”之勢。

  中國高校的頂流“清北”對新技術自然非常關注。從企業(yè)端大模型來看,很多創(chuàng)始人出自清華,如百川智能王小川、瀾舟科技周明、小冰公司李笛、面壁智能劉知遠等。

  而在校園內,清華大學不少團隊都在研究大模型,目前由于兩個團隊做了開源大語言模型。

  今年6月,清華大學NLP實驗室聯(lián)合智源研究院成立的開源組織OpenBMB發(fā)布了一個最高有100億參數(shù)規(guī)模的開源大語言模型CPM-BEE,功能包括文字填空、文本生成、問答等。

  清華大學最新和字節(jié)跳動合作的又是開源大語言模型,不過SALMONN這個大模型的長處是語音,其可支持語音、音頻以及音樂輸入,他可以感知和理解不同類型的音頻內容輸入,并具備多語言語音識別和翻譯以及語音推理等功能。

  在不少從業(yè)者看來,通用大模型是通才,對教育領域或者其他特定領域的作用有限,因此,各行各業(yè)需有垂類大模型。就如美國課外輔導在線教育公司Chegg,原本只是應用ChatGPT大模型,現(xiàn)在也在自研教育垂類大模型。在企業(yè)之外,高校在垂類大模型方面也走在了前列。

  今年7月4日,北京大學聯(lián)合兔展智能推出了中文法律大模型“ChatLaw”,它可以提供提供對話、寫作、知識庫三種模式,能給法律小白們答疑解惑、提供法律建議,被網(wǎng)友稱為“大模型中的‘羅翔老師’”。

  7月13日,上海交通大學重慶人工智能研究院在西部(重慶)科學城正式發(fā)布“兆言”大模型,這個是一個針對行業(yè)的大模型,“兆言”寓意為“兆文厚積,言出成章”。

  根據(jù)介紹,“兆言”具有精度高、效率高、成本低三大特點,更好地賦能制造、醫(yī)療、金融、文旅、法律、服務等行業(yè)領域。

  浙江大學也一直關注技術前沿,今年4月,微軟亞洲研究院聯(lián)手浙江大學的研究團隊,發(fā)布了一個大模型協(xié)作系統(tǒng)HuggingGPT,連接HuggingFace社區(qū)中的各種AI模型,來完成多模態(tài)復雜任務。

  今年8月,浙江大學再進一步,推出多個垂類大模型。

  浙江大學聯(lián)合高等教育出版社、阿里云等發(fā)布基于通義千問7B(70億參數(shù))模型訓練的「智海-三樂」教育垂直大模型,三樂出自《孟子》“得天下英才而教育之,三樂也”,這是教育一詞的起源,寓意重視教育是亙古不變的話題。

  根據(jù)介紹,浙江大學的智海-三樂教育垂直大模型以阿里云通義千問7B通用模型為基座,基于核心教材、領域論文和學位論文等教科書級高質量語料和專業(yè)指令數(shù)據(jù)集繼續(xù)預訓練和微調。智海-三樂集成了搜索引擎、計算引擎和本地知識庫等功能,將于9月在全國13所高校應用,可提供智能問答、試題生成、學習導航、教學評估等能力。

  浙江大學人工智能研究所和摸象科技聯(lián)合研發(fā)中國首個垂直金融零售的語言大模型「智海-金磐」大模型,可為金融機構提供高效、智能的語言服務,包括金融知識問答、金融文本生成、金融對話機器人等多種應用場景。

  國內唯一以“語言”命名、以傳播中國語言文化為主的國際型大學北京語言大學亦是將目光對準了垂類模型,推出了國際中文教育領域的大模型“桃李”(Taoli)1.0。

  根據(jù)介紹,“桃李”在通用中文基座模型上擴充了國際中文教育領域專有詞表,使用了該領域專有數(shù)據(jù)集進行指令精調,增強了大模型在該領域多項任務上的理解能力。

  在功能上, “桃李”可以根據(jù)學習者的情況作出反饋,幫助學生模擬真實的語言交際場景;具有文本糾錯功能,能夠分別進行最小改動糾錯與流利提升糾錯,并能深入分析錯誤原因;具有作文評分功能,能夠自動對作文水平進行評判,幫助學生自主學習。

  此外, “桃李”能夠方便國際中文教師整合教學資料,提供教學思路,提升教學質量。例如輔助生成教學過程中需要做的教案、幻燈片中需要展示的例句、課堂需要給學生提供的課外素材等。

  還有一些高校大模型進行了預發(fā)布,比如西北工業(yè)大學基于華為昇騰AI的面向飛行器的首個流體力學大模型——“秦嶺· 翱翔”。

  可以看到,高校研發(fā)的大模型越來越專業(yè)、細分。  

  從教育垂類大模型來看,浙江大學的智海-三樂和北京語言大學的桃李都算是教育的垂類大模型,他們既面向學生,又面向老師。相比而言,桃李專門針對漢語言學習,會更細分。

  此外,很多高校大模型背后都有企業(yè)的身影,比如清華大學與字節(jié)跳動合作,浙江大學與阿里云合作,西北工業(yè)大學與華為合作等??梢哉f,當前產(chǎn)教融合進入到新階段,前置到技術研發(fā)層面。

  02

  他山之石:國外高校重在為我所用?

  跟國內高校聚焦大模型相比,國外高校似乎更看重為我所用,引導師生用好AI工具。

  雖然有的學校也推出了大模型,但是更像是為某一門課程專門研發(fā),如哈佛大學。

圖片

  今年6月,哈佛大學CS50項目導師David Malan教授在郵件中提到,從秋季學期開始,CS50將使用自主研發(fā)的語言模型CS50 Bot作為助教。

  CS50是哈佛大學入門級計算機科學課程,也是計算機系王牌課程,同時,CS50是edX上最受歡迎的課程之一,edX(在線教育公司2U旗下平臺)是麻省理工學院(MIT)和哈佛大學(Harvard)合作打造的在線學習平臺。

  CS50 Bot是哈佛大學自研的一個大語言模型,它將負責在課堂上回答學生的課程問題,提供個性化的指導和代碼debug,給學生的作業(yè)提出修改意見,7*24小時可以回答各種學生疑問。

  通常,CS50 會有數(shù)百名校園學生和 40000 多名在線學生學習,現(xiàn)年 46 歲的 Malan 教授表示,即便上課過程中有 100 多名助教,也很難完全回答來自不同時區(qū)、知識和經(jīng)驗水平不同的學生所提出的問題。

  而借助CS50 Bot,該課堂可以解決以上問題,且可以實現(xiàn)1對1學習服務。

  不過,Malan教授向學生強調:“不管是接受人還是機器的信息,我們都要需要有批判思維。”

  可以說,哈佛大學推出CS50 Bot,這算高校教育的一個里程碑。

  在此之前,很多高校認為禁止學生使用AI工具,認為會對學生學習產(chǎn)生負面影響;而有的學校完全放開,認為可以幫助學生更好的學習和成長;還有一些學校允許學生有條件地使用,兼顧學生成長和教育原則。

  哈佛大學的做法則受到廣泛認可,從解放教師的角度出發(fā),將人工智能工具為我所用;同時,引導學生正確使用AI工具。

  緊跟著,就在8月22日,密歇根大學推出了面向全校師生和職工的一個生成式人工智能平臺,秋季開學開始啟用。據(jù)了解,該平臺是由密歇根大學信息與技術服務部(ITS)開發(fā)的,部分功能將在9月30日后收費。

  密歇根大學的校長小野三太表示:“這是全美第一家提供生成式AI平臺的學校。”

12.png

       據(jù)密歇根大學官網(wǎng)介紹,該大學將為全社區(qū)提供三種生成式AI服務,包括:U-M GPT、U-M Maizey和U-M GPT Toolkit。

  U-M GPT,允許用戶使用生成式AI工具,如ChatGPT等大模型工具,這項功能將是免費的。

  U-M Maizey,它是一個聊天機器人和短信系統(tǒng),允許用戶訪問人工智能語言模型來查詢和質疑他們自己的數(shù)據(jù)集,U-M Maizey可以連接到谷歌和Canvas等平臺。

  U-M GPT Toolkit,為用戶大規(guī)模構建、訓練和托管AI模型提供了平臺,它針對高級AI開發(fā)者提供了各種需求。

  密歇根大學可以說是有條件地讓學生使用AI工具的又一個典范。

  可以說,今年秋季是一個新的節(jié)點,全球高校開啟探索“AI模式”。

  END

  本文作者:王上