新質生產力 作品

第2024章 AI人物觀點:算力十問,大模型將橫掃所有垂直行業

 《kimi人工智能月度報告丨Ai人物觀點》 

 關鍵詞:算力十問 

 1.沈向洋:大模型將橫掃所有垂直行業 

 “大模型大到一定地步以後就湧現出來。多大才湧現出來?沒人講得清楚。”3月23日,2024全球開發者先鋒大會在上海開幕,美國國家工程院外籍院士沈向洋在《大模型時代的機遇和挑戰》的演講中分享了關於大模型的五方面思考。 

 第一,大模型的到來,強迫人類重新思考人機關係。“我們受到的衝擊,到底有多少是機器智能的發展,有多少是人機交互的震撼。”他認為,不管是什麼技術,最終目的是幫助人更好運用機器,不忘初心。 

 第二,大模型將橫掃所有垂直行業。大模型可分為通用大模型、行業大模型、企業大模型和個人大模型。“一個通用大模型如果沒有萬卡、不上1萬億參數,基本上以後就不太好意思說這是一個通用模型了。行業大模型大致上是千億參數、千億卡的訓練規模。企業大模型可能只需要100張卡、百億參數。最有意思的是個人大模型,利用個性化參數,結合雲和端,這是非常有意義的。” 

 第三,算力是門檻。影響算力的兩大因素是模型大小和數據規模,隨著參數增加,對算力的需求幾乎是幾何級的。“千卡萬卡是錢堆出來的。以前有一句話叫貧窮限制想象力,現在貧窮可能扭曲想象力,因為如果沒有卡,能想象要做的項目可能就不太一樣了。” 

 第四,Ai帶來社會衝擊。這些衝擊包括對民眾的衝擊、企業的衝擊、政府監管的衝擊、社會發展的衝擊,帶來一本正經胡說八道、深度偽造等倫理問題,很多國家開始立法,這需要共同推動治理、向前發展。 

 第五,智能的本質。人工智能蓬勃發展,但人們對智能的本質並沒有清晰認知。“大模型大到一定地步以後就湧現出來。多大才湧現出來?沒人講得清楚。”沈向洋表示,“很多人相信scaling law(規模法則),但今天的深度學習,理論非常欠缺。從宇宙到量子,物理學有一套大一統的理論統一起來,叫作theory of everything。今天深度學習沒有這樣的理論,所以叫作theory of Anything。” 

 2.中國工程院鄔賀銓院士:《算力十問》