首頁 >國際 >

【世界新要聞】大模型競速絕非“大廠游戲”

4月11日,阿里云大模型通義千問正式官宣。近日,大模型領域“新兵”不斷涌現(xiàn),王小川的百川智能、商湯科技“日日新”、昆侖萬維“天工”……無論是否與互聯(lián)網(wǎng)領域直接相關,企業(yè)們入局ChatGPT的速度與熱情絲毫不受影響。越來越多的互聯(lián)網(wǎng)大佬下場創(chuàng)業(yè),體量較小的企業(yè)也紛紛推出自己的大模型。圍觀者驚嘆,原來高投入的大模型從來都不只是“大廠之間的游戲”,大家爭分奪秒的到底在爭搶什么?

“諸神之戰(zhàn)”

一天之內,大模型領域迎來了三位重量級的嘉賓。


(資料圖)

先是搜狗公司創(chuàng)始人王小川,一封公開信正式宣告了“百川智能”的誕生。據(jù)了解,百川智能旨在打造中國版的OpenAI基礎大模型及顛覆性的上層應用。

緊接著,兩家公司先后官宣。在當天的技術交流日上,商湯科技董事長兼CEO徐立展示了“日日新”體系下的語言大模型“商量”,據(jù)悉,這是一個1800億參數(shù)的中文大語言模型,可實現(xiàn)多輪對話、邏輯推理、語言糾錯、內容創(chuàng)作、情感分析等。

與此同時,昆侖萬維也表示,即將推出對標ChatGPT的雙千億級大語言模型“天工”3.5,并定于4月17日啟動邀請測試。當晚,昆侖萬維發(fā)布2022年年報,明確提到“未來10年將堅定的‘All in’AGI與AIGC?!?/p>

大模型成了這一輪AIGC浪潮的兵家必爭之地。百度“文心一言”、阿里“通義千問”、騰訊“混元”、京東“ChatJD”、華為“盤古”,傳統(tǒng)大廠無一掉隊。

垂直領域諸多企業(yè)紛紛入局,除商湯科技及昆侖萬維外,科大訊飛也在互動平臺表示,將于5月6日發(fā)布訊飛預訓練大模型的詳細信息,大模型將用于教育、翻譯等領域。

互聯(lián)網(wǎng)大佬們更不畏懼大模型的“從0到1”。公開報道顯示,王慧文的 “光年之外”A 輪融資后估值已達到10億美元,前商湯科技副總裁閆俊杰新公司MiniMax的首款大模型產(chǎn)品Glow累計用戶已突破百萬。

華西證券研報總結了現(xiàn)有國產(chǎn)大模型的兩個特征:一是頭部廠商主導,to B為主要模式,賦能原有優(yōu)勢業(yè)務;二是均未對公眾大面積開放,未有明確的to C入口,實際水平不透明。

通用還是垂直

AIGC產(chǎn)業(yè)主要分為基礎和應用兩個層面,前者包含理論框架的搭建、大模型的訓練以及算法等,大投入、智力密集和長期性三個特點缺一不可。而后者主要是將別人開發(fā)出的東西與自己的業(yè)務進行整合,見效快,成本相對也較低。

而這也是當下中國AIGC企業(yè)押注的兩個方向。有人勢要成為中國的OpenAI,但也有人將目光瞄準了垂直領域的應用。

天使投資、資深人工智能專家郭濤表示,根據(jù)AI大模型應用范圍的不同,可以分為通用型大模型和產(chǎn)業(yè)型大模型,通用型AI大模型在企業(yè)級與消費級市場都擁有廣泛的應用場景,如OpenAI旗下的ChatGPT;而產(chǎn)業(yè)型的AI大模型主要應用于垂直行業(yè)或細分應用場景,如京東旗下的ChatJD。

“整體來看,通用型大模型應用場景相比產(chǎn)業(yè)型大模型更為廣泛,隨著規(guī)?;⒍鄻踊瘧脠鼍暗穆涞?,促使算法模型快速迭代升級,不斷豐富和拓展新的應用場景,市場競爭力也將會不斷增強。”郭濤認為。

但全聯(lián)并購工會信用管理委員會專家安光勇則提到,通用大模型在應對多樣化任務時具有競爭力,而專業(yè)大模型在特定領域有深厚的技術積累和應用優(yōu)勢。

安光勇認為,體量相對較小的企業(yè)在大模型領域與“大廠”搶的主要是技術創(chuàng)新和應用場景的拓展。相較于大廠,“小廠”在技術創(chuàng)新上通常更加靈活和敏捷,能夠迅速響應市場需求,快速推出具有差異化和競爭力的大模型產(chǎn)品。

此外,小廠在應用場景上可能更加專業(yè)化和垂直化,能夠深入某一領域或行業(yè),提供定制化的解決方案,滿足特定客戶的需求。此種專業(yè)化和靈活性為小廠在大模型領域與大廠競爭中帶來了一定的優(yōu)勢。

“‘大廠更適合做模型’其實是一種慣性思維?!痹Z智能聯(lián)合創(chuàng)始人兼COO朱雷解釋稱,通用的大模型解決不了具體行業(yè)的問題,尤其是在國內,大部分高質量中文語料都在行業(yè)內,而不在公域的互聯(lián)網(wǎng)內,即便是大廠也很難拿到行業(yè)數(shù)據(jù),從這個角度上看,專用的模型在特定領域的效果一定要比大公司的通用模型更合適。

AIGC該降溫了

不久前,國際權威咨詢機構IDC發(fā)布的《2022中國大模型發(fā)展白皮書》中預測,2026年中國人工智能軟件及應用市場規(guī)模將達到211億美元,人工智能進入大規(guī)模落地應用關鍵期。

數(shù)據(jù)顯示,自2020年起,中國的大模型數(shù)量驟增,僅2020-2021年,中國大模型數(shù)量就從2個增至21個,和美國量級同等。

薩摩耶云科技集團首席經(jīng)濟學家鄭磊認為,在通用大模型方面,中美存在時間差,而應用層則各有千秋。大模型訓練成本高,初創(chuàng)企業(yè)目前投入的資金很快就會消耗光,“建議政府將其作為新基建項目,引導社會資金共同投資”。

此外,鄭磊提到,由于還存在可能替代大模型的其他技術路線,國家也應關注,及時加強研究支持,縮小與歐美技術差距。對于中小企業(yè)來說,可以根據(jù)市場定位和行業(yè)發(fā)展趨勢,選擇已有的合適的大模型作為垂直應用研發(fā)的基座,逐步形成AI賦能的產(chǎn)品和服務,借助市場力量推動產(chǎn)品研發(fā),形成在細分領域的競爭優(yōu)勢。

上個月末,一覽科技推出業(yè)界首個基于GPT大模型的“文本+圖片+虛擬人”視頻AIGC全域工作流,彼時,一覽科技創(chuàng)始人兼 CEO羅江春就曾提到,AIGC工具只會越來越多,同質化非常嚴重,說是新一輪“百團大戰(zhàn)”也不為過,關鍵的問題是誰能解決某一個垂直領域用戶的根本需求。

“大模型需要降溫了?!庇谫Y本市場,深度科技研究院院長張孝榮做出了這樣的判斷。在他看來,大模型是人為炒作起來的一個現(xiàn)象,前期是國際巨頭推廣產(chǎn)品,后期是國內資本市場跟進,炒作相關企業(yè)股價,許多公司股價脫離理性軌道,在短短幾個月的時間內翻了數(shù)倍,導致資本市場發(fā)燒。

關鍵詞:

責任編輯:Rex_12