第904章 關鍵在於算法
落地窗外的景色被鍍上了一層金黃。
休息區內,靜謐中透著幾分閒適。
葉回舟、信息部的楊閒以及小胖子王濤圍坐在一張木質圓桌旁。
桌上,三杯咖啡正冒著嫋嫋熱氣。
咖啡的香氣在空氣中瀰漫開來,為這略顯嚴肅的氛圍添了幾分溫馨。
楊閒剛看完馬斯克g3的發佈會,此刻滿臉失望。
他輕輕將手中的平板電腦放在桌上,率先打破了沉默。
“今天看了馬斯克g3的發佈會,實在是太讓人失望了。
這號稱地表最強的ai大模型,依我看,完全是在走彎路。”
葉回舟正端起咖啡杯,輕抿一口。
聽到楊閒的話,眼中閃過一絲好奇。
他放下杯子,問道:“怎麼個走彎路法?我還沒仔細瞭解呢,你給詳細說說。”
楊閒輕嘆一口氣,身子微微前傾,緩緩說道:“你瞧,g3發佈會給出的數據看似耀眼得很。
在數學科學和編程的基準測試上,確實超越了不少主流模型。
像gpt4o、cloud3.5、deptv3這些,在它面前都得甘拜下風。
而且在推理能力方面,g3.ingta和g3min reasoning的跑分也超過了同等級的其他模型。
比如說deeptr1還有openai的o3mini。”
小胖子王濤正百無聊賴地轉著手中的鉛筆,聽到這兒,不禁皺起眉頭,滿臉疑惑。
“聽起來很厲害呀,那還有什麼可失望的?”
楊閒無奈地搖了搖頭,用手指輕輕敲著桌面,解釋道:“問題就藏在這些看似厲害的數據背後。
你看,數據差距其實很小,gpt4o差不多1400分,g3也就1400分左右。
只差20多分,也就1%多一點的差距。
deepr1是1360分,和g3的差距也就2%左右。
這種微小差距可能只是跑分的小誤差,或者僅僅是記憶能力的體現。
況且,為了這點差距,它訓練用了10萬克的英偉達h100的gpu。
累計訓電時長達2億gpu小時,就為了這微不足道的差距,付出如此巨大的代價,簡直是資源的極大浪費。”
葉回舟聽著,陷入了思考。
他輕輕轉動著咖啡杯,緩緩說道:“確實,如此龐大的算力投入,感覺有點得不償失。
但你覺得這就能說明馬斯克方向錯了嗎?”
楊閒推了推眼鏡,身子往後靠了靠,接著說:“我覺得可能性很大。
他過度依賴跑分,要知道跑分這東西是可以作弊來營造優勢的。
很多模型看著跑分很高,但實際使用起來卻不盡人意,就像之前的glock2。
g3耗費這麼多資源,才比其他模型多那麼一點分數,就好比用大量資源去換取微不足道的優勢。
再看看人類大腦,人腦功率10到30瓦,卻能展現出強大的能力,關鍵就在於算法。
像李菲菲團隊用50美金復現deep seek,就證明了一個模型強大與否,核心在於思考和推理能力,而非規模。”
小胖子王濤若有所思,停下手中轉動的鉛筆,摸著下巴說:“我明白你的意思了。
這就好比我們學習知識,要是隻靠死記硬背,考試能應付,但實際應用就不行。
ai要是隻依賴大量記憶數據,沒有真正的推理和思考能力,也算不上真正的智能。”
葉回舟點頭表示認同。
他拿起勺子,輕輕攪拌著咖啡,說道:“沒錯,所以像deep使用的moe混合專家模式,就很類似大腦節能的方法。
而且gpt系列模型,從gpt3到gpt4,參數不斷增大。
可從人類發展角度看,人腦並沒有因參數顯著增大而變得更聰明。”
楊閒又補充道:“再看ai發展的總體趨勢,現在的ai就像溫水裡的青蛙。
就拿歐洲來說,德國和法國這樣的強國,各有心思。
德國是經濟強國,法國是軍事強國,可即便組合起來,也未必能稱霸歐洲。
面對美國政策,歐洲反應混亂,美國態度的變化,才讓歐洲看清美國本質。”
小胖子王濤一臉好奇,眼睛睜得大大的:“歐洲現在的情況和ai有什麼聯繫呢?”
葉回舟耐心地解釋道:“在科技發展方面,歐洲也存在類似問題。