十月廿二 作品

第757章 流形學習

 “我們就是在想,如何才能不用這個人,但實現一樣的效果。”

 “這個麼……”

 朱雅丹瞬間縮了縮頭:

 “我只是隨便一說……但有些時候人腦的作用或許還是沒辦法代替的……”

 餐桌周圍又恢復了平靜,只剩下偶爾發出的微弱咀嚼聲。

 但常浩南仍然沒有動筷子。

 “你說得對。”

 幾分鐘之後,當朱雅丹都快要吃完麵前盤子裡的炒麵時,常浩南突然開口道:

 “人類的大腦能夠通過某種辦法解析高維數據,從而獲取對外部世界的感知。”

 “?”

 朱雅丹滿腦袋問號地抬起頭,但看著常浩南思考的樣子,很有自知之明地沒有打擾。

 “換句話說,具有高維數的外部信息必定潛在於一個低維空間中的非線性流形結構上……”

 在近70年前,美國統計學家哈羅德·霍特林就已經提出過將高維數據進行降維的主成分分析法。

 他認為方差越大提供的信息越多反之提供的信息越少,於是通過原分量的線性組合構造方差大、含信息量多的若干主分量,再進行矩陣奇異值分解,實現數據維數的降低。

 但主成分分析法只相當於找到投影距離最小的意義下的最佳線性映射,而現實中卻沒有那麼多簡單的線性問題。

 不過,這個思路卻是可以被借鑑的。

 常浩南放下只吃了一口的羊湯麵,蹭地站起身,快步離開食堂。

 身負安保職責的朱雅丹趕緊跟上。

 姚夢娜的反應稍微慢了一點,剛想起身,又意識到還沒結賬,只好掏出錢包,無奈地走向收銀臺。

 回到辦公室的常浩南重新找到了剛才那張紙。

 在三個基本條件下方又寫下了幾行字。

 給定一組高維數據x={x1,x2,…,xn}?rd,n為數據樣本個數,d為高維數據的維數。

 再假設x中的數據樣本來自於或近似來自於低維嵌入空間中的數據y={y1,y2,…,yn}?rd。

 尋找一個從高維觀測空間到低維嵌入空間的映射關係??,使得yi=??(xi),以及一個一對一的重構映射關係??^-1,使得xi=??^-1(yi)。

 寫到這裡,常浩南的臉上露出了一個滿意的微笑。

 儘管仍然沒有給出完整的思路,但是,他至少已經把三個抽象的基本條件解析成為了一個具體的數學問題。

 而對於理論研究來說,明確地提出問題,幾乎也就相當於走完了成功之路的一半。

 想到這裡,他回到這張紙的最上面,重新寫下六個字。

 流形學習方法。