甚至有時(shí)候根本復(fù)現(xiàn)不出來(lái),畢竟如果別人論文里沒(méi)寫清楚,鬼知道他的參數(shù)是怎么調(diào)的。
現(xiàn)在光靠自己,這個(gè)課題已經(jīng)推進(jìn)不下去了,按照周昀的預(yù)估,就算agileed不涉及到圖像方面的數(shù)據(jù),需要的顯存不像視覺(jué)領(lǐng)域那么夸張,也至少要大概100g左右的顯存,這個(gè)數(shù)字是他結(jié)合前世的科研經(jīng)驗(yàn)得來(lái)的。
而現(xiàn)在最好的消費(fèi)級(jí)顯卡4090的顯存也就24g,a卡則是自動(dòng)被剔除在外,因?yàn)槠錄](méi)有cuda的存在,幾乎不可能用于ai訓(xùn)練。
而專業(yè)級(jí)顯卡的價(jià)格更是讓現(xiàn)在的周昀望塵莫及,就拿常用的a6000來(lái)看,48g顯存,價(jià)格三四萬(wàn),更強(qiáng)的h100甚至要十幾二十萬(wàn)一張。
也就是說(shuō),想要跑得動(dòng)周昀這個(gè)模型,至少十萬(wàn)打底。
這也是為什么他要找一個(gè)有資源的導(dǎo)師了,如果是那些小導(dǎo),整個(gè)組里可能就一張4060,別說(shuō)跑實(shí)驗(yàn)了,平時(shí)自用都?jí)騿堋?/p>
都說(shuō)會(huì)哭的孩子有奶吃,你不主動(dòng)說(shuō),導(dǎo)師就算有資源也不會(huì)主動(dòng)給你的。
周昀給鄧永華發(fā)了一條消息。
【老師,之前給您匯報(bào)過(guò)的那個(gè)ai邊緣部署的課題我有了一些新的想法,不過(guò)我自己的電腦沒(méi)法跑實(shí)驗(yàn),需要服務(wù)器,不知道組里有沒(méi)有?】
(請(qǐng))
從沒(méi)打過(guò)這么富裕的仗
發(fā)完消息,稍微等了幾分鐘,還沒(méi)回,估計(jì)要么在上課,要么在開會(huì)。
沒(méi)辦法,導(dǎo)師就是這樣的,他發(fā)你消息必須秒回,你發(fā)他消息,等幾個(gè)小時(shí)都是常有的事,他都習(xí)慣了。
將手機(jī)放到一邊,登上了自己github賬號(hào)。
創(chuàng)建了一個(gè)新的repositories,將其設(shè)置為公開,名字就叫學(xué)習(xí)記錄。
自從用上了github,周昀就將它當(dāng)成了一個(gè)萬(wàn)能的記事本。
不管是代碼還是閱讀筆記或者是學(xué)習(xí)筆記,他都會(huì)記在上面。
雖然前世自己從事了兩年多的ai方面的科研工作,但是他知道,自己所接觸的,不過(guò)都是一些皮毛。
其最為主要的原因就是,他的數(shù)學(xué)功底不夠扎實(shí),這也導(dǎo)致了自己的研究只能停留在最為表面的部分。
數(shù)學(xué)是所有學(xué)科的基石,特別對(duì)于計(jì)算機(jī)這門應(yīng)用型學(xué)科來(lái)說(shuō)。
就比如前幾年在視覺(jué)領(lǐng)域最為常用的卷積,其實(shí)早在18世紀(jì)就被提出了,而其真正運(yùn)用到神經(jīng)網(wǎng)絡(luò)則是在20世紀(jì),這其中相差了百年。
還有很多看上去非常nb的算法,其背后不過(guò)就是一些普通的數(shù)學(xué)公式運(yùn)用。
但這也足以可見,數(shù)學(xué)對(duì)于計(jì)算機(jī)的重要性。
周昀學(xué)習(xí)數(shù)學(xué)的目的也不是要去證明什么猜想,那可以說(shuō)是神的領(lǐng)域,就算現(xiàn)在他確實(shí)聰明不少,他也不會(huì)不自量力地去碰這些東西。