東南肥肥 作品

第904章 關鍵在於算法

 午後的陽光慵懶地灑在晚霞山莊操盤大廳的休息區。

 落地窗外的景色被鍍上了一層金黃。

 休息區內,靜謐中透著幾分閒適。

 葉回舟、信息部的楊閒以及小胖子王濤圍坐在一張木質圓桌旁。

 桌上,三杯咖啡正冒著嫋嫋熱氣。

 咖啡的香氣在空氣中瀰漫開來,為這略顯嚴肅的氛圍添了幾分溫馨。

 楊閒剛看完馬斯克g3的發佈會,此刻滿臉失望。

 他輕輕將手中的平板電腦放在桌上,率先打破了沉默。

 “今天看了馬斯克g3的發佈會,實在是太讓人失望了。

 這號稱地表最強的ai大模型,依我看,完全是在走彎路。”

 葉回舟正端起咖啡杯,輕抿一口。

 聽到楊閒的話,眼中閃過一絲好奇。

 他放下杯子,問道:“怎麼個走彎路法?我還沒仔細瞭解呢,你給詳細說說。”

 楊閒輕嘆一口氣,身子微微前傾,緩緩說道:“你瞧,g3發佈會給出的數據看似耀眼得很。

 在數學科學和編程的基準測試上,確實超越了不少主流模型。

 像gpt4o、cloud3.5、deptv3這些,在它面前都得甘拜下風。

 而且在推理能力方面,g3.ingta和g3min reasoning的跑分也超過了同等級的其他模型。

 比如說deeptr1還有openai的o3mini。”

 小胖子王濤正百無聊賴地轉著手中的鉛筆,聽到這兒,不禁皺起眉頭,滿臉疑惑。

 “聽起來很厲害呀,那還有什麼可失望的?”

 楊閒無奈地搖了搖頭,用手指輕輕敲著桌面,解釋道:“問題就藏在這些看似厲害的數據背後。

 你看,數據差距其實很小,gpt4o差不多1400分,g3也就1400分左右。

 只差20多分,也就1%多一點的差距。

 deepr1是1360分,和g3的差距也就2%左右。

 這種微小差距可能只是跑分的小誤差,或者僅僅是記憶能力的體現。

 況且,為了這點差距,它訓練用了10萬克的英偉達h100的gpu。

 累計訓電時長達2億gpu小時,就為了這微不足道的差距,付出如此巨大的代價,簡直是資源的極大浪費。”

 葉回舟聽著,陷入了思考。

 他輕輕轉動著咖啡杯,緩緩說道:“確實,如此龐大的算力投入,感覺有點得不償失。

 但你覺得這就能說明馬斯克方向錯了嗎?”

 楊閒推了推眼鏡,身子往後靠了靠,接著說:“我覺得可能性很大。

 他過度依賴跑分,要知道跑分這東西是可以作弊來營造優勢的。

 很多模型看著跑分很高,但實際使用起來卻不盡人意,就像之前的glock2。

 g3耗費這麼多資源,才比其他模型多那麼一點分數,就好比用大量資源去換取微不足道的優勢。

 再看看人類大腦,人腦功率10到30瓦,卻能展現出強大的能力,關鍵就在於算法。

 像李菲菲團隊用50美金復現deep seek,就證明了一個模型強大與否,核心在於思考和推理能力,而非規模。”

 小胖子王濤若有所思,停下手中轉動的鉛筆,摸著下巴說:“我明白你的意思了。

 這就好比我們學習知識,要是隻靠死記硬背,考試能應付,但實際應用就不行。

 ai要是隻依賴大量記憶數據,沒有真正的推理和思考能力,也算不上真正的智能。”

 葉回舟點頭表示認同。

 他拿起勺子,輕輕攪拌著咖啡,說道:“沒錯,所以像deep使用的moe混合專家模式,就很類似大腦節能的方法。

 而且gpt系列模型,從gpt3到gpt4,參數不斷增大。

 可從人類發展角度看,人腦並沒有因參數顯著增大而變得更聰明。”

 楊閒又補充道:“再看ai發展的總體趨勢,現在的ai就像溫水裡的青蛙。

 就拿歐洲來說,德國和法國這樣的強國,各有心思。

 德國是經濟強國,法國是軍事強國,可即便組合起來,也未必能稱霸歐洲。

 面對美國政策,歐洲反應混亂,美國態度的變化,才讓歐洲看清美國本質。”

 小胖子王濤一臉好奇,眼睛睜得大大的:“歐洲現在的情況和ai有什麼聯繫呢?”

 葉回舟耐心地解釋道:“在科技發展方面,歐洲也存在類似問題。