
第6章 四路泰坦的力量
刘明远推开挂着常务副主任牌子的办公室,牛剑跟在他后面进入屋中,目光左右快速扫了一遍。
书柜上满是红色的奖状和金色的奖状,不过其中最为扎眼,也最大的就是那个被挂在墙上的“国家科技进步奖”的证书。
“哎呀,正好吴院士也在这里,那就不用我跟小牛再多跑一趟了。”
刘明远看到坐在办公桌前聊天的二人,露出了喜色。
“我这次是带牛剑过来拜码头来了。”
刘明远微微侧过身,把牛剑让了出来。
“之前都见过,这种形式上的事情就不用搞了,坐,坐!”
吴院士兴致很高,待牛剑坐到面前后便直截了当的问起了上次面试时未竟的问题。
“小牛啊,面试的时候你那个项目的思路非常新颖,我们这边还没搞明白生成式AI是什么东西,你居然就已经用上了。”
“现在时间足够,你好好给我讲一下,这个用对抗生成网络扩增风电数据,到底是怎么一回事啊?”
换做一般人,这种形式上的拜访突然变成技术交流,或许会有些措手不及,但牛剑却没有一点迟疑,简单回忆了一下便开了口。
从数据预处理到选择合适的对抗生成网络算法,牛剑讲的头头是道。
曾经那些烂大街的小技巧,在吴院士、杨主任和刘主任耳中却宛如醍醐灌顶一般,让他们不住的点着头。
毕竟那可是不知多少研究者耗费许多日夜才内卷出来的最优路线,即便说起来只是寥寥数句话,但对于最终的效率却都是质一般的提升。
“在模型训练方面,我采用了输入随机噪声+条件标签的方式,拟合出了合成数据序列……”
“慢一点,小牛,等我把之前内容记下来。”
流畅的讲述被打断,但牛剑并没有觉得烦躁,反而是耐心的把之前讲的东西又给吴院士重复了一遍。
这看起来很离谱,一个新入职的人居然在给单位的首席科学家兼主任,以及另外两个领导讲课,但却是实际发生的事情。
把所有东西记下来之后,吴院士通盘看了一遍,满是喜色的脸上不由得出现了一点疑惑。
“小牛啊,你的硕士论文我也看了,但在里面并没有发现这些内容啊!”
没想到吴院士居然还专门把牛剑的论文下载下来看了一遍,而且听上去看的还颇为仔细。
“这些都是训练模型的时候的小技巧,我觉得跟学术上的问题没什么关系,所以就没往上放。”
“这倒也是。”吴院士没在这个问题上过多深究。
讲完牛剑的毕业设计之后,四人又就着牛剑的个人发展聊了一会。
不知为何,便拐到了是否继续深造一方面上。
“如果有机会的话,当然想!”
面对杨主任问出的‘是否想要读博’这一问题,牛剑给出了明确的答复。
看到这股昂扬的精气神,其他三人不由得露出了微笑。
“我跟牛剑就不打扰领导们了,接下来还要带他去实验室跟兄弟们见见面。”
跟两个领导告别后,刘明远带着牛剑穿过数道防火门,走进了一个有些喧嚣的公共办公区内。
和杨主任办公室里的宁静淡雅不同,这个办公区始终响着高性能计算机全速工作的风扇噪声。
大部分人对于牛剑的到来都表示了欢迎,不过当着刘主任的面,表现的都比较内敛。
只不过在吴奇这里,却是稍微多耽误了一些时间,他此刻正念叨着:“梯度消失......不对,残差连接应该放在这儿......”
根本没有听到一旁同事的动静。
牛剑的目光集中到屏幕上,然后便被那个题目所吸引了。
‘《基于 LSTM的股价预测模型优化》?’
他在内心默念了一遍,吃惊的发现面前这个身材有些矮小,其貌不扬的男生居然还是个潜在的量化大佬。
“吴奇!”
在刘明远第三次重复他的名字后,吴奇终于反应过来,慌不迭的站起来问了个好。
“接下来希望你们好好带一带牛剑,让他早点适应我们这的科研节奏。”
见过一圈人后,刘明远简单说了几句话,便拉着牛剑走到早就给他准备好的工位上。
黑色的塔式机箱看起来就不是什么便宜货色,牛剑把自己的包放到椅背后面,坐下来摁了开机键。
系统已经做好,而且还是双系统,一下子省了他很多功夫。
作为一个资深垃圾佬,牛剑第一反应便是点开设备管理器,看看这个电脑什么配置。
不过只是一眼,便让他低声发出惊呼。
“卧槽,四路泰坦!”
这个之前只在梗里见过的配置,如今却水灵灵的出现在了他的面前。
CUDA核心总数 9216,显存48GB,这种配置放到世界变化前或许不足为奇,但在如今却是最为顶级的存在。
“还有128GB的内存,双路CPU,牛逼,真的牛逼。”
按照旁边任恒宇的提醒,趁还没联入内网,牛剑把一些自己的资料用移动硬盘拷入了这台个人服务器。
其中自然就包括Deepseek 1.5b和7b两种不同参数的模型源码。
用上午剩余的时间,牛剑在服务器上完成了1.5b模型的部署,中午简单吃了个饭后,他没有午休,直接便开始了测试。
‘写一个C++的插入排序示例。’
和之前在笔记本上问的相同的问题,不过前几天牛剑可没得到完整的答案。
连续的高负荷工作让那台笔记本直接蓝屏死了机,把牛剑吓了一大跳,重新开机确认源码没有问题之后才舒了一口气。
不过这一次明显就不一样了,仅仅过了一秒,对话框里便出现了‘Thinking’的字样。
很快,在构件好完整的思考链以后,大模型给出了自己的答案。
‘void insertionSort(int arr[], int n)……’
牛剑将其复制到编译器里,点击了生成并运行。
“0错误,0警告,很好,很好!”
这就是算力提升所带来的优势,纵然Deepseek极大减少了训练过程中对计算卡的压力,但在推理端却依然十分依赖显卡的数据吞吐性能。
“48G的显存,如果装全量8bit的模型,大概能支撑到32B参数量的Deepseek,换成4bit量化过的模型就是70B参数。”
牛剑略微算了一下,但却并不打算直接把那种‘过于先进,不便展示’的东西拿出来。
正所谓饭要一口口吃,贸然拿出那么多东西,反而会带来不必要的麻烦。
测试完大模型,牛剑伸了个懒腰,准备晚上小加会班,看看研究室的公共服务器上都有什么好东西。
之前刘明远提过他们搞了不少数据存了上去,这对于大模型来说可都是顶好的东西!
“第一天就这么勤奋哇,看来不用担心你适应不了我们这的节奏了。”
“任恒宇你还笑,小心被牛剑甩的没影哦~”
下班时间到,几个人围到牛剑旁边,作为老人,第一天自然是对新人有所表示。
“走,牛剑,今天刚上班,就放纵一下,咱去东门老火锅聚个餐去!”