两人对视一眼,都有些无奈。
他们原本的打算,是从相对最简单J.Y.P开始,然后是S.M,最后是体量最大,背景最深,最财大气粗,也是对油管业务重合度相对最高,但是合作几率最小的Mnet。
结果现在出现的测试结果,让罗纪和权老大两个人都有点计划被打乱的感觉。
本来他们还想这么暗示Mnet:S.M和J.Y.P已经入局了,你说你来不来?
想到这里,权老大有点心烦:“再试一试?提高一点J.Y.P的权重,略微降低S.M的看看?”
“来吧,要不然还能怎么办呢。”罗纪点点头,按照权老大的想法做出了一点调整。
测试的过程还是漫长的。罗纪和权老大坐在办公室里,看着快速变化的屏幕。
一边等,权老大一边说道:“你的算法原理,是一种通过特定算法进行带负反馈的视频推荐。说实话很适合做这件事,很不错。”
罗纪对于这份肯定没有什么心理波动,只是有些奇怪:“油管的算法机制里,电机观看视频这个操作提供的是正反馈,但是只看视频计算播放量。而如果没有点赞的操作,都会被划分为低权重的负反馈。所以这正反馈给模型带来的影响,经常被负反馈给抵消冲刷掉。”
盯着屏幕,罗纪沉思道:“而我给这个评测系统用的算法框架,做的属于是根据韩国用户吝啬点赞的习惯,使得韩国一定地区的一定人口观看油管视频时,只要不低于一定程度负反馈权重情况下,其过程是得到一定程度削减的负反馈,和正反馈按照一定比例互相抵消,也能对观看视频提供推荐。并且调大了相关标签的选取范围。按理说这个思路绝对没问题。”
权老大皱着眉说道:“确实。你的想法没什么错误。本来我们两个装上评测系统之后,大多数播放量其实也是无用播放量。这些很多都是低权重负反馈,应该反而会让这一切越来越和后边的视频拉开差距,Q-Learning模块应该不会出错。”
思索片刻,权老大猜测道:“是不是你这边用的Q-Learning模块内部出现了问题?”
罗纪没有说话,只是陷入了沉思。
说实话,权老大看到的并不是罗纪的完整算法。罗纪也不可能所有事情都和权老大说。
事实上,罗纪制作的评测系统算法其实内有玄机。评测系统将来会变成一个模块没错。但是他还堆叠模块。
而权老大所指的Q-Learning算法模块,实际上并不是货真价实的Q-Learning,而是一种叫Deep-Q-Network的算法。简单来说,DQN就是Q-Learning的升级版,所以罗纪命名模块也不算有错。
只不过,最重要的是这个Deep,指的是Deep learning。也就是未来十多年内AI发展热门的深度学习,罗纪未来主要研究的方向。
而在现如今的2010年,几乎没有卷积神经网络代码能使用的情况下,罗纪自行编卷积写神经网络,手动实现了网络的前向反向传播。
就这么一个简单的评测系统,采用了对于现在理论都还未完全实现,在后世的一种深度学习架构。
并且就算这个模块被拆解了,这个世界,能够理解罗纪架构是如何完成的人也不多。对方如果没有深入了解神经网络的原理和数学,是很难了解罗纪这个完全不一样的“Q-Learning”到底是干什么的。
这就是重生者带来的属于时代的知识碾压!