亚图小说网
首页 > 都市言情 > 重回05,从校内网开始狂卷! >

第250章 允许失败的勇气&下一款产品

章节目录

  “怎么,不服?”

  “怎么会呢爷~”宋锦忍受着心头的屈辱,扬起一个甜美的笑脸,掰开男友搭在她大腿上的黑手。

  像挠狗子一样,挠了挠女友的下巴,洛川抻了个大大的懒腰,喊过一旁正噼里啪啦敲代码的瑶瑶姐,交给她一个新任务。

  开发一款语音助手。

  这款应用,将内置于下一代星光旗舰机。

  未来的智能家居战略,也能用得上。

  技术组成,大致可分为硬件层和软件层。

  硬件层,需要定制麦克风阵列,并集成自研的“自适应波束成形”算法,以实现3米远拾音、嘈杂环境降噪、区分用户与他人声音等等。

  同时需自研低功耗语音唤醒算法,以免这款应用成为“电量杀手”。

  就跟siri刚诞生时那样。

  同时,还需跟高通合作,签订排他性协议,深度定制SoC,在下一代芯片中,固化语音处理专用指令集。

  如离线唤醒词监测、基础指令本地处理等等。

  这一块,其实可以放在云端处理,但如果直接将指令集嵌入芯片DSP中,可以大幅提高响应速度,效果更佳。

  可惜星光那边的芯片研发设计,仍处于起步阶段,这两年估计是用不上自家设计的芯片了。

  其次是算法层,大致可分为四个大项。

  其一,语音识别。

  可采用基于隐马尔可夫模型的语音识别技术,结合高斯混合模型提升识别准确率,自研端侧轻量化语音识别模型。

  这两种理论早已出现,但前世直到12年,才有“机灵鬼”,将前者应用到实际的商业语音识别产品之中。

  将两者混合的模型,更是在很长一段时间内都鲜有人问津。

  当然,想要实现两者相结合的混合模型的超前应用,自然也需要下一番功夫。

  首先需要收集海量的语音数据,涵盖各种不同的口音、语速、语调及使用场景,用以训练模型,这对计算资源的要求极高。

  巧的是,极光既有海量的用户,又有强大的云计算资源~

  只需再开发引入自适应学习率的算法,使得模型在训练过程中,能够根据数据特点,自动调整学习速度,进而提高训练效率即可。

  同时也可采集粤语、鲁省方言、东北话等方言,组成方言库,以支持语音识别。

  不过这个功能倒也不急,可在后续版本迭代中再加入。

  反正前世直到13年,另一款主流手机语音助手,siri,才支持中文。

  其二,自然语言处理。

  需要构建一个语义理解模型,解析用户指令的意图。

  可通过规则引擎+统计学习的混合方案。

  规则层,内置500条高频场景模版,比如“导航去公司”。

  统计层,可利用悠米社区和极光微博中,数以百亿条公开语料,训练朴素贝叶斯分类器,以提升意图识别准确率,处理模糊指令。

  比如,用户说“太冷了”,语音助手自动查询天气,并给出关窗、添衣服等建议。

  之后也可基于地理位置,同智能家居联动。

  此外,还可将简单的神经网络模型引入其中,以提升模型的泛化能力,以及处理复杂指令的能力。

  放在深度学习刚刚起步的今天,自然算是难如登天。

  但你说巧不巧,洛川最擅长的就是深度学习~

  宋锦同学深有体会~

章节目录
书友推荐: 穿清造反,从太监开始 四合院:回到六十年代 美利坚大网红从无耻之徒开始 Bug之主,从生命炼金开始 三国:季汉继任丞相! 咸鱼重生 遮天:我为东皇太一 吞噬星空:从抽卡开始成就浑源 斗罗:从领域开始的女主之路 抗战:从常德保卫战开始 你对死灵法师有意见? 我以科举证长生 以天才之名 道友托孤:从养成妖女开始长生 年代剧:老曹的潇洒人生 当明星哪有飞升香 斗破:全图最强,我永远在你之上 重生末世:开局中奖3000万 系统出错后,我成了LCK话事人 霍格沃茨:中国式教授