甚至有時候根本復(fù)現(xiàn)不出來,畢竟如果別人論文里沒寫清楚,鬼知道他的參數(shù)是怎么調(diào)的。
現(xiàn)在光靠自己,這個課題已經(jīng)推進不下去了,按照周昀的預(yù)估,就算agileed不涉及到圖像方面的數(shù)據(jù),需要的顯存不像視覺領(lǐng)域那么夸張,也至少要大概100g左右的顯存,這個數(shù)字是他結(jié)合前世的科研經(jīng)驗得來的。
而現(xiàn)在最好的消費級顯卡4090的顯存也就24g,a卡則是自動被剔除在外,因為其沒有cuda的存在,幾乎不可能用于ai訓(xùn)練。
而專業(yè)級顯卡的價格更是讓現(xiàn)在的周昀望塵莫及,就拿常用的a6000來看,48g顯存,價格三四萬,更強的h100甚至要十幾二十萬一張。
也就是說,想要跑得動周昀這個模型,至少十萬打底。
這也是為什么他要找一個有資源的導(dǎo)師了,如果是那些小導(dǎo),整個組里可能就一張4060,別說跑實驗了,平時自用都夠嗆。
都說會哭的孩子有奶吃,你不主動說,導(dǎo)師就算有資源也不會主動給你的。
周昀給鄧永華發(fā)了一條消息。
【老師,之前給您匯報過的那個ai邊緣部署的課題我有了一些新的想法,不過我自己的電腦沒法跑實驗,需要服務(wù)器,不知道組里有沒有?】
(請)
從沒打過這么富裕的仗
發(fā)完消息,稍微等了幾分鐘,還沒回,估計要么在上課,要么在開會。
沒辦法,導(dǎo)師就是這樣的,他發(fā)你消息必須秒回,你發(fā)他消息,等幾個小時都是常有的事,他都習(xí)慣了。
將手機放到一邊,登上了自己github賬號。
創(chuàng)建了一個新的repositories,將其設(shè)置為公開,名字就叫學(xué)習(xí)記錄。
自從用上了github,周昀就將它當(dāng)成了一個萬能的記事本。
不管是代碼還是閱讀筆記或者是學(xué)習(xí)筆記,他都會記在上面。
雖然前世自己從事了兩年多的ai方面的科研工作,但是他知道,自己所接觸的,不過都是一些皮毛。
其最為主要的原因就是,他的數(shù)學(xué)功底不夠扎實,這也導(dǎo)致了自己的研究只能停留在最為表面的部分。
數(shù)學(xué)是所有學(xué)科的基石,特別對于計算機這門應(yīng)用型學(xué)科來說。
就比如前幾年在視覺領(lǐng)域最為常用的卷積,其實早在18世紀(jì)就被提出了,而其真正運用到神經(jīng)網(wǎng)絡(luò)則是在20世紀(jì),這其中相差了百年。
還有很多看上去非常nb的算法,其背后不過就是一些普通的數(shù)學(xué)公式運用。
但這也足以可見,數(shù)學(xué)對于計算機的重要性。
周昀學(xué)習(xí)數(shù)學(xué)的目的也不是要去證明什么猜想,那可以說是神的領(lǐng)域,就算現(xiàn)在他確實聰明不少,他也不會不自量力地去碰這些東西。