《天才之上》第145章 草台班子的第一次會議(1)

作者:一桶布丁·2個月前

「大家好,我陳耀宗,目前工作主要是研究機率論。駱教授跟我提了喬源博士的這個想法後,我就開始思考能否將機率圖模型,比如高斯過程應用到這個問題上。

但思考過後從理論上來說,這是個很蠢的辦法。首先我們需要建立一個帶有優質跟劣質標籤的大規模論文資料集,然後將之轉化為監督分類問題。

顯然是建立這麼一個論文資料集就是個極大的工程。而且要辨別論文是優質還是劣質,或者水論文字需要一個標準………」

。…從最佳化的角度看,我們的目標是要為一個高度非凸且可能存在平坦區域的損失曲面,找到一個能通向全域最優的路徑。

在我看來,一篇高質量的論文,其證明路徑在象的邏輯空間中所形的幾何軌跡應該是迂迴的,但最終能收斂……」

「……我認為可以嘗試將一篇論文的論證過程建模為一個離散力系統。其穩定和收斂可以類比為論證的嚴謹和有效………」

。……基於以上論證,所以我的想法是,我們也許可以從更基礎的特徵工程開始做起。

傳統AI做文字分類,特徵無非是詞袋。TF-IDF。主題模型如LDA。我們可以嘗試構建一個多模態模型,同時理文字。公式和圖表……」

。……直接從知識圖譜的補全形度切來說,訓練一個模型,當輸一篇新論文P時,它能判斷出P是否填補了圖譜中一個關鍵的空

我們可以借鑑圖神經網路,比如GraphSAGE或GAT,來預測這篇論文在目前知識網路中的重要程度……「我覺得剛剛各位老師都說得很好,我是學資料探勘的,之所以希這個課題,主要還是希能提升自我。

如果一定要說想法,我覺得就是可以利用無監督學習,對大量論文的嵌向量做一個聚類。我覺得學的差異或許會對映在不同聚類中心之間的距離和形狀上。

這樣就可以計算一個廓係數的變種,並依此來衡量一篇論文相對於已有知識的位置。

這其中有些是我之前的想法,有些是我剛聽魯教授的發言想到的。

不管如何我的主要目的還是學習和提高,會盡力完佈置給我的任……」

喬源坐在駱餘馨旁邊,默默聽著這個臨時組建的興趣小組員們的發言。

然後發現他似乎小看了燕北大學的底蘊。

雖然說人都是駱餘馨一天找到的,但從發言上看,這些人都是有想法的。

甚至已經從各自的研究層面論證了他這個想法的可行

他本以為如此倉促組的小組肯定是個草臺班子。

但現在他不這麼看了。

只能說燕北大學的底蘊有些可怕。隨便拉幾個人都是能人。

有想法,有見地,有經驗,甚至還很有執行力………

當然這也是喬源的錯覺了。

雖然燕北大學的確很強,但還沒強到這種程度,更關鍵的原因還在於現在還是寒假。

而且跟駱餘馨拉的人,大都是比較瞭解的那一批。本就把一批打算混文憑的淘汰了。

此時所有人都已經將目集中到了他上。

畢竟大家都發過言了,只剩喬源了。

「嗯,首先謝大家剛剛提出的寶貴意見。接下來我簡單談談我的想法。

IA

IAIA

IA

使

猜你喜歡

同題材或同分類的其他作品。