“没错,就是你们理解中的那个汉语。”
迎着众人疑惑的目光,洛川肯定了他们心头的猜测。
当前,极光通用大模型,与一众欧美科技巨头的AI模型,除了参数量,领先1~2个数量级之外,还有很大的一个不同点,正是在于语言逻辑。
西方的AI模型,都是以英语为底层语言逻辑。
包括国内绝大多数科技企业,也同样如此。
一方面是因为,其习惯性抄老美作业。
另一方面,自AI浪潮爆发之后,国内多数企业,特别是互联网巨头,大批量从欧美巨头挖人。
这又进一步加重了各家AI模型的西化。
也就提早入场的百度,内部孵化了大量国内人才。
那么在AI领域,汉语和英语的差异,具体体现在哪里呢?
其一,词汇体系与语义逻辑。
英语是“词本位”表音文字,其词汇体系,随着科技、社会发展的无限膨胀,导致词汇量呈指数级暴增!
截至当前,英语词汇已超100万!
且每年新增数万!
这意味着,以英语为底层语言逻辑的AI模型,需持续适配新增孤立词汇。
不仅增加训练词汇量与算力负担,还容易出现语义割裂。
简单来说,就是新词汇与原有词汇,缺乏强关联,导致模型对新生概念的理解,滞后且片面。
就像近两年,人工智能、元宇宙、区块链等概念爆发,英语世界不得不造出“Artificial Intelligence”、“Metaverse”、“Blockchain”等新词。
AI模型也得重新训练这些独立词汇的语义、语境,才能融入现有体系。
反观汉语,为“字本位”表意文字,核心汉字仅3000余常用字。
几乎无需创造任何新字符,仅需通过现有汉字重新组合,就能精准表达新生概念。
以此为基础语言逻辑的模型,也可直接复用单字语义库,无需额外训练新词,训练效率至少可提升50%以上!
比如,中文里的“车”字,能组合出汽车、火车、电动车、自动驾驶车等等。
模型懂了“车”的核心语义,就能快速理解所有衍生概念。
其二,数据密度。
同等信息下,中文表达的字符,比英语至少低30%~40%,数据传输与存储成本更低。
这意味着,中文单字承载的语义密度更高,模型可通过更少字符,获取更丰富的信息,运算效率显著提升。
这便是老祖宗,为我们留下的宝贵财富~
阐述完这一点,洛川也没管众人理不理解,便继续点出了国内企业的第三点优势——广阔的AI落地场景!
这一点就不用过多介绍了。
以极光当前的AI应用为例。
极光云的“城市大脑”项目,已接管多个城市的信号灯路口,通行时间平均降低15.3%!
极光云“工业大脑”,已全面接管星光超级工厂,生产效率较传统汽车工厂,呈倍数级提升!
极光与岛城合作的全自动化码头,靠AI与物联网技术,实现集装箱装卸全程无人化!
效率比国外同类码头,提升50%以上!
等等等等。
更关键的是,这些场景,并非孤立的试点,而是可复制、可推广的范本。
比如,“城市大脑”项目,从魔都扩展至岛城、京城等多个城市。
极光智能制造解决方案,目前已通过星光供应链、生态链,渗透进28个细分行业。