“没有理论框架支撑,你那些底层代码早晚会因为内存溢出而崩溃。C先生需要的是一个能把算法工业化工程化的高级人才,而不是一个高级码农。”
两人你一言我一语,直接在机场到达大厅开启了技术互喷模式。
要不是他们吵架用的是英语。
估计这里看热闹的人能比现在多。
周志云站在旁边看着这剑拔弩张的场面,心里乐开了花。
岑言这小子,真是个玩弄人心的高手。
他早就料到这两个人见面后会是这种火星撞地球的反应。
技术天才都有自己的骄傲。
把他们放在同一个笼子里,他们自己就能卷出天际。
“两位,两位先停一下。”
周志云看火候差不多了,适时地出声打断了他们的争论。
他抬起手,示意两人冷静。
“机场这里人多眼杂,不是讨论技术细节的地方。车已经在外面等好了。”
周志云看着他们。
“C先生已经把初步的架构图和百张P100显卡的机房准备好了,两位感兴趣,我们现在就可以去算力中心。”
“到了那里,你们有的是时间用代码证明自己。”
利昂和卢卡斯一挑眉,互相瞪了一眼,同时推着行李车跟上周志云的步伐。
走出机场航站楼。
周志云安排了一辆宽敞的商务车。
利昂和卢卡斯分别坐在后排的两侧,谁也不理谁,各自拿出笔记本电脑,开始紧张筹备,等一会可能要面对的问题。
与此同时。
包厢里。
岑言看了眼时间,已至八点。
他拿起搭在椅背上的外套,站起身来。
“你们先聊,我得去一趟张江那边。”
岑言看着众人交代。
白棠刚喝一口酸梅汤,听到岑言要走,立马抬起头来。
“这么晚了还要去实验室吗?”
白棠语气里有些不舍,她还想趁着今天刚刚做出成果,可以休息一下,想约岑言晚上去江边散步。
“不是去实验室。”
岑言把外套穿好,晚上还有点凉。
“算力中心那边有点事,老周接了两个人过去,我得去见一面,把接下来的架构开发任务落定。”
周妍在一旁点头,她知道岑言说的谁。
那两个被岑言从谷歌钓过来的工程师,关系新模型落地的关键人物。
“行,那你路上注意安全。”
周妍提醒道。
“放心吧,晚点我带星彩和佳乐去酒店办入住,明天她们俩还要去老校区那边逛逛熟悉环境,我就负责给她们当导游了。”
“麻烦妍姐了。”
纪星彩十分乖巧地道谢。
从小到大已经擅长了见人说人话,见鬼说鬼话的纪星彩,已经和周妍混熟了。
现在都已经叫上妍姐了。
岑言走到包厢门口,和大家挥了挥手,转身下楼。
走出饭店,夜晚的京海依旧车流如织。
岑言在路边拦了一辆出租车。
“师傅,去这里......。”
岑言报上地址。
司机师傅很是淡漠地应了一声,一脚踩下油门汇入车流。
岑言坐后排看着窗外不断倒退的夜景。
他在盘算接下来的计划。
利昂和卢卡斯是他用技术手段硬生生挖过来的,能进入谷歌工作的,那都是计算机领域的天才,心高气傲在所难免。
把这两个人放在一起,就像在一座山上放了两只老虎,谁也不会服谁。
岑言很清楚,技术人员的交流方式非常简单直接。
想让他们心甘情愿地留下来卖命干活,光靠画大饼和给高薪是不够的。
必须在技术上对他们形成绝对的碾压,把他们的骄傲彻底踩碎,让他们知道在这里能学到在谷歌学不到的东西。
这才是技术人员的最终信仰。
只有这样,他们才会死心塌地留在这个初创的团队里。
车子在一个巨大的厂房前停下。
岑言付了车费,推开车门走下去。
这就是周志云找关系批下来的过渡用的算力中心。
这里比李所还要简陋。
厂房外面停着几辆工程车,一楼的大门敞开着。
里面灯火通明,不少工人正在紧张地进行电缆排线和机柜固定工作。
一百张P100显卡组成的算力集群可不是摆两台电脑那么简单。
供电系统、散热系统、网络交换机,每一项都需要专业的人员来施工。
岑言避开地上的线缆,沿着楼梯走上二楼。
二楼被临时隔出了几个办公室和会议室,作为运维人员和架构师的办公区域。
此时,二楼最里面的一间会议室里。
如果尴尬的气氛能降温的话,那这里跟南北极估计没什么差别。
周志云坐在会议桌前,双手捧着纸杯,一脸。
会议桌两端,分别坐着利昂和卢卡斯。
两个人各自抱着笔记本电脑,双手在键盘上飞速敲击。
这里只有键盘敲击声,谁也没说话。
从机场接到这两个人开始,这股剑拔弩张的氛围就没停过。
在车上的时候,两人就因为一个底层算子的优化问题吵了一路。
到了算力中心,看到这简陋的临时办公环境,两人本来还有些不满。
但周志云直接带他们去看了一楼那正在搭建的百张P100显卡机柜。
看到这些崭新的、还没撕掉保护膜的顶尖算力硬件,两个人的眼睛都直了。
真金白银砸出来的算力集群摆在面前,谁也无法拒绝这种诱惑。
虽然谷歌其实拥有更多的硬件。
但这不代表他们能够随意使用,甚至是支配,很多时候,谷歌的硬件都是随项目配给的。
他们立刻要求找个地方开战。
周志云把他们带到二楼会议室,还让人泡了茶水送过来。
结果这两个人一坐下,打开电脑就开启了互喷模式。
利昂攻击卢卡斯的数学模型。
说他的模型现在实在是太臃肿,在分布式训练里会严重拖慢节点之间的通信速度。
卢卡斯则是狠狠地跳脸嘲讽利昂写的底层代码缺乏泛化性,只能针对特定长度的文本,根本没理解自注意力机制的本质。
两人倒是素质挺高,没说什么脏话。
但倒是苦了周志云,他在一旁听得头大如斗,插不上话。
他作为机器学习领域的专家,京海交大的副院长,在面对这两个研究底层架构的谷歌工程师时,还是暴露出明显的技术代差。
理论和应用是两个阶段。
而院校学术和企业实践又是相差甚远。
这不是中华的问题,也不是京交的问题,是机器学习这个领域的问题。
这个专业领域本身就需要大量的资源。
而企业有商业需求的情况下,发展速度将会比院校快很多。
而且资金量的投入也不是一个级别的。
没办法,周志云只能安分地坐在旁边当个端茶倒水的看客。
“卢卡斯,你看看这个位置编码。”
利昂停下敲击键盘的动作,把电脑屏幕转过去,指着上面的一段代码。
“你试图用绝对位置嵌入来解决序列的顺序问题,这在短文本里没问题。”
“但如果输入序列长度超过一千个词,你的参数量会成倍增长。”
利昂有些不屑地说道。
“在多头注意力计算的时候,这些庞大的位置嵌入矩阵会把显存吃得一干二净。你的模型根本跑不起来。”
卢卡斯摇了摇头。
“利昂,你的眼光还是那么狭隘,所以我说你没能留在山景城呢。”
卢卡斯不屑地笑了笑。
“如果不加入绝对位置嵌入,模型怎么知道单词的先后顺序?你以为自注意力机制是万能的吗?它只是一种加权求和,本身是不包含位置信息的。”
卢卡斯看着利昂。
“你提出的那种用正弦和余弦函数直接叠加的方法,理论上可行。但在实际的代码实现里,你打算怎么把这些三角函数优雅地融合到张量乘法里?”
“你!这里!.....”
两人互相揪着对方的问题,再次陷入僵持。
互相看不顺眼,又互相无法彻底说服对方。
他们的水平本就不相伯仲。
而且这个方向又没有绝对的正确。
思想在这里碰撞、迸发。
周志云在一旁看似悠哉悠哉地喝着茶,实则心里暗暗着急。
岑言这小子怎么还不来。
这两人要是再吵下去,不会直接在会议室里动手打起来吧?
就在这时。
会议室的门把手转动了一下。