beplay2網頁登錄
beplay2網頁登錄
清華成果落地,領跑國產AI大模型!
2024-09-23 13:30
清華大學
作者:

在國內自主研發大模型的企業中

由清華大學計算機係知識工程實驗室

轉化而來的“智譜”

無疑是一抹亮眼的存在

其研發的大模型GLM-4

多項性能比肩大模型GPT-4

係列開源模型全球下載量超2000萬

是目前下載量和開源影響力

最高的國產大模型之一

從“實驗”走向“市場”

“智譜”麵向公眾上線

生成式視頻功能“清影”

具備視頻通話功能的軟件“清言”

將前沿的科學技術轉化成為

人人可用的AI助手

“智譜”公司的CEO

正是清華大學計算機係

1998級本科、2002級碩士校友

張鵬

讓我們一起走近

“報國清華人”係列報道

共同感受清華人在各行各業

服務國家和人民的拳拳報國誌!

翻越技術的圍牆

“中國要有自己的預訓練模型框架”

1998年

來自湖北的張鵬

考入清華大學計算機係

通過深度參與實驗室課題項目

他很快找到了自己的研究方向

“文本數據挖掘和語義分析”


爬山時的張鵬

在校期間

他先後發表10餘篇頂會文章

設計了國內首個

中英文平衡的跨語言知識圖譜係統

畢業後張鵬選擇加入

清華大學計算機係知識工程實驗室

繼續探索前沿科技

2006 年起

實驗室開始研究大數據挖掘與知識圖譜

孵化了

科技情報大數據挖掘與服務係統平台

—— AMiner係統

隨著係統的不斷成熟

團隊開始考慮商業化

在2019年6月將AMiner單獨拆分出來

成立新公司“智譜”

2020年,Open AI發布

參數規模達1750億的GPT-3模型

吸引世界關注

在國外人工智能產品的衝擊下

“中國要有自己的預訓練模型框架”

成為一種共識


張鵬參加中國計算機大會

GPT、BERT、T5

都是西方科學家提出的底層技術

沿著已有路徑走無疑最省力

然而

“核心的技術是求不來也買不來的”

作為清華人

要為國家、民族和社會做點事情

想要掌握前沿領域的先進技術

有些圍牆必須越過

張鵬和團隊成員走上了

艱難但可靠的自主研發道路

在大語言模型(LLM)浪潮中

團隊驚喜地發現

自研的預訓練框架——GLM

對人類輸入意圖以及一些常識

或者知識類信息理解能力

有著意想不到的表現

打破國外壟斷

實現“彎道超車”有了希望

團隊當即決定

投身到GLM預訓練框架研發中

訓練成本高、人力投入大、過程不穩定

麵對行業公認的難題

張鵬認為

“雖然局麵複雜困難

但我們想做一些自己的事情”

通過不斷對算法優化、量化

在保證精度和推理速度情況下

1300億參數規模的雙語預訓練模型

GLM-130B

最終運行成本降低75%

同時

堅持自主研究

還帶來適配國產化硬件的優勢

從源頭杜絕信息泄露的可能

為國內信息安全上了一把“安全鎖”

2022年11月

斯坦福大學大模型中心

對全球30個主流大模型進行全方位評測

團隊研發的GLM-130B

作為亞洲唯一入選的大模型

在魯棒性、校準誤差和無偏性方麵

取得了亮眼的成績

“在同等或更小規模上

我們能達到世界頂尖水平

甚至在某些指標上更為領先”

張鵬介紹

AI大模型飛入尋常百姓家

“我們的技術要去解決一些實際的問題”

在清華大學計算機係

“貫天、接地、通心、樹人”理念影響下

張鵬對“科技服務於人”

有著深刻理解

北京2022年冬奧會吸引著世界目光

冰上運動隨之走入千家萬戶

各種專業術語

和新聞主播200餘字/分鍾的語速

總讓手語老師“手忙腳亂”

如何更好地滿足

聽障朋友了解比賽需求?

此刻

正是“大模型”在社會服務方麵

發揮作用的關鍵時刻


團隊研發的手語播報數字人

通過“大模型”理解音頻語義

利用語義蒸餾模型、手語翻譯模型

團隊將語音轉化為手語

結合肌肉綁定技術驅動實現麵部采集

最後

出現在北京衛視舞台上的數字人

以流暢自然的手語翻譯

為千千萬萬聽障朋友

帶來高效、精準的實時解說

北京2022年冬奧會圓滿結束

“翻譯官”卻沒有“下班”

紮實的技術帶來長久效應

團隊研發的手語播報數字人

至今活躍在電視台、網絡平台

景區與公共服務廳

持續為聽障朋友們提供無障礙服務

前進!邁向通用人工智能

“讓機器像人一樣思考”

科技的世界你追我趕

先進的技術迭代升級

2023年8月31日

基於ChatGLM研發的產品

“智譜清言”上線

為用戶實時提供

通用問答、虛擬對話、代碼生成

創意寫作等多方麵服務

前沿科學技術

成為人人可用的AI助手

2024年1月16日

團隊發布新一代基座大模型GLM-4

與上一代相比

GLM-4有著更為亮眼的數據

性能全麵提升60%

達到比肩GPT-4的水平

升級之後的大模型

能夠根據用戶意圖理解、規劃複雜指令

自主調用網頁瀏覽器

Code Interpreter代碼解釋器

文生圖CogView3模型等

工具完成複雜任務

單次處理的文本達300頁

2024年7月

“智譜”上線生成式視頻功能“清影”

僅需一段話,或一張圖

30秒就能自主生成

一段1440×960清晰度的高質量視頻

“智譜清言”麵向所有用戶開放


視頻通話功能在辦公場景的應用

2024年8月30日

“智譜清言”再次進行重大升級

上線了國內首個

麵向客戶端開放的視頻通話功能

用戶隻需打開視頻通話界麵

便能享受到

如同與AI“麵對麵”的交流體驗

智譜大模型實現了

從語言文字、圖片

再到視頻的模態跨越

麵向人工智能國際先進水平的模型矩陣

初具規模

“讓機器像人一樣思考”

在技術進步中探索未來的無限可能

人工智能在解放生產力同時

也為科技創新留下了更多發展空間

從將清華實驗室研究成果轉化

到百億、千億模型發布

再到細分領域AICG模型

及產品矩陣搭建

腳踏實地

致力於產品研發升級

張鵬和團隊每一步都走得穩紮穩打


張鵬

“未來,大模型能幫大家做很多事情”

在張鵬和團隊的夢想中

大模型之後

是實現通用人工智能的最終目標

圍牆之外的探索還在繼續

新的路徑將會通往何方?

通用人工智能的願景何時能夠實現?

清華人張鵬和智譜團隊

繼續步履不停

在一步步探索前進中尋找答案

更多報國清華人的成長故事

我們將繼續為你講述……

免責聲明:

① 凡本站注明“稿件來源:beplay2網頁登錄”的所有文字、圖片和音視頻稿件,版權均屬本網所有,任何媒體、網站或個人未經本網協議授權不得轉載、鏈接、轉貼或以其他方式複製發表。已經本站協議授權的媒體、網站,在下載使用時必須注明“稿件來源:beplay2網頁登錄”,違者本站將依法追究責任。

② 本站注明稿件來源為其他媒體的文/圖等稿件均為轉載稿,本站轉載出於非商業性的教育和科研之目的,並不意味著讚同其觀點或證實其內容的真實性。如轉載稿涉及版權等問題,請作者在兩周內速來電或來函聯係。

相關新聞