AI语音独角兽云知声冲击科创板,造芯力、市场刨食力受关注

36氪 36氪 ·

2020-12-21 11:48:08

次阅读

不久前,云知声正式向上交所提交IPO招股材料,并顺利进入问询阶段。

不久前,云知声正式向上交所提交IPO招股材料,并顺利进入问询阶段。

2012年夏天,在国内语音识别圈子里,黄伟“出走”创业的消息不胫而走。作为语音识别领域内技术实力派,黄伟此前长期担任摩托罗拉的资深研究员,帮助公司推出了世界上首款声纹识别手机;之后,他又出任盛大创新院核心高管,并创建了名噪一时的语音分院。

高光履历,黄伟的“去处”无疑引发了业界关注。而没过多久,一间名为“云知声”的语音识别公司便正式注册成立。

用黄伟自己的话说,即使已经在语音领域取得过不少的成绩,但在刚刚成立云知声的时候,公司的具体方向并未完全确定,只是看到了移动设备的飞速发展。不过,他未曾怀疑的是,在未来的智能设备上,“声音”一定会成为一种十分重要的交互方式,在各类商业场景中大有可为。

对于略显“浮躁”的科技创业圈,类似“18个月就是时间窗口”、“6个月就是创业公司生死线”的口号并不陌生。对比之下,真正依靠创新技术,并持续将其投入到各类商业应用场景的企业却少之又少。而眼下,云知声却已悄悄度过了自己的第八个生日,并成为AI语音细分行业的重要玩家。

从语音识别赛道起步,到提供完整的智能语音解决方案,伴以启动造芯、提出“云-端-芯”产品战略……八年间,云知声的技术能力、工程能力和产业能力均不断趋向成熟。云知声已成长为了一间具有“全栈”力的AI语音公司。而此时,或也正是云知声向下一目标发力、冲刺资本市场的合适时间。

不久前,云知声正式向上交所提交IPO招股材料,并顺利进入问询阶段。对此,业界热议称,“科创板AI语音第一股”或即将诞生。众望之下,云知声的科技硬实力究竟体现在哪里?企业的商业护城河又有多高?在资本的加持下,云知声的未来发展又会产生哪些改变?

八年AI语音积淀 从独角兽到冲击科创板

上世纪80年代,美国未来学家阿尔温 托夫勒的科技巨著《第三次浪潮》正式出版,书中大胆预测了以计算机、数字技术为核心推动力的数字时代,掀起了科技界关于“信息社会”的乐观期待。

热情付诸实践,未来已经到来。2010年以后,数字经济高速增长,全球正式进入移动互联网时代。其中,以5G、人工智能等为代表的新基建革命,更是成为了数字经济中最重要的动力来源。

值得注意的是,在这一时期,不仅各类联网设备种类繁多,联网的场景也不断产生新突破。用户除了可以通过手机、电脑等常见硬件接入网络,各类家居、家电,甚至医疗和汽车硬件等,均能化身网络接口,丰富联网的商业场景。

此种背景下,AI视觉和语音赛道孕育而生,逐渐成为国内人工智能市场的重要组成部分。与图像相比,语音的交互流程和交互逻辑更为复杂,这也决定了其产品应用商业落地的复杂性与难度更高,用户对于产品性能的期待值也更高。另一方面,图像相对于语音赛道而言,也拥有着更为固定的场景应用。因此,图像领域的商业变现更加稳定。

市面上有一种声音说,对于语音公司而言,要生存,就意味着更加考验团队的“市场刨食”能力。而在这一层面,云知声的技术积淀和商业化应用路径或值得行业借鉴。

在智能语音交互产品方面,云知声目前已可以提供跨硬件平台、跨应用场景、 云端芯一体的物联网语音交互产品,同时还能面向行业级客户、覆盖“感知”、“认知”、“决策” 等不同层次的智能语音工具产品。而在智慧物联解决方案领域,公司则主要面向酒店、社区、住宅、医院等特定场景,提供智慧物联综合解决方案,帮助众多企业级客户实现用户与设备、设备与设备之间的互联互通互动。

对于云知声在AI语音赛道的发展逻辑,黄伟总结道,“因为我们在行业的最前沿,不是在研究室,所以我们更知道客户需要什么,这个技术如果要满足场景化需要的话,我们必须做什么。”

两次少数派抉择 升级商业变现能力

赛道精准定位后,企业的可持续变现亦需要强大的创新能力支撑。对此,云知声的两次技术抉择不得不提。其中,在2012年率先引入DNN,便可以算得上云知声的第一次“少数派”尝试。

所谓DNN,指的是“深度神经网络算法”,可成功将以往的语音识别率显著提高,是近几年来工业界和学术界有关机器学习领域的一个流行话题。不过,模型正确性验证复杂,需要更多的时间和金钱来试验,同样是DNN的主要特征。

对于彼时刚进入创业起步期的云知声,企业的试错成本可想而知。但在这个时刻,黄伟还是做出了启用DNN的决定。在他看来,随着算力的提升和样本库的扩大,DNN是最行之有效的一种提升AI“智商”的路径,更高的成本也意味着更高和更快速的回报。

而在后期的商业实践中,云知声的这一技术预判也被证实为正确且高效。在选择DNN之后,云知声产品的语音识别准确率迅速大幅度提升,并很快达到了投入商用的标准。而从现在绝大多数企业的选择来看,DNN也已经成为了主流选择。

而云知声的第二次少数派选择,则体现在了其对人工智能语音芯片的布局上。但对比于选择DNN算法,云知声的“造芯”之路则经历了更大的质疑。

由于各项人工智能核心技术都具有运算密集型的特性,其对硬件算力便具备了刚性需求,物联网边缘侧芯片在提供充足算力的同时,还需要综合考虑功能、功耗、成本、可靠性等多项因素。因此,如果没有从端侧提供足够算力的能力,又没有相对便宜的底层硬件支撑,公司有再好的云侧智能解决方案也难以落地,丰厚的商业回报更无从谈起。

正如黄伟所言,“不做芯片就是死路一条”,这不是一个好与更好的问题,而是一个“to be or not to be”的问题。你认为这个事情必须要做,那做就是了。

尽管备受争议,但在如今看来,这一次造芯抉择却成为云知声区别于其他AI语音公司,并塑造科技护城河的重要原因。

公开资料显示,云知声自2015年起,展开布局人工智能语音芯片,着手开发uDSP处理器和DeepNet IP技术,并在此基础上,于2018年率先交付人工智能语音芯片——“雨燕”,2019年陆续推出车规级芯片“雪豹”和面向家居领域的第二款升级版芯片“蜂鸟”系列,并启动具备“图像+语音”多模态交互功能的芯片“海豚”的研发,持续领跑同业……

根据云知声披露的招股书,公司2018年的营业收入,同比2017年增长了3倍,其主要来源便体现在了芯片和硬件领域。而如果没有亲自涉足芯片制造,云知声或无法大规模、低成本的为产业赋能,也便无法真正迈出技术的小圈子,走进产业的大圈子。

总结公司的发展过往,如果要给云知声的每一次“少数派的选择”定性,或许就是——始终站在实际解决问题的角度,站在用户体验的高度,站在实际解决用户需求的方向上。

多商业应用场景 期待资本加码赋能

在自有芯片的加持下,云知声将技术商业化落地的能力迅速加强。在具体商业应用中,公司现已顺利开拓了智能语音交互产品与智能物联解决方案两个系列,并在家居、医疗领域收获了广泛的认可。

在住宅和酒店场景,云知声以空调语音模组为突破口,通过与格力等家电龙头企业深入合作,并拓展形成了覆盖数十种物联网设备的物联网语音交互产品系列,在此基础上,公司进一步将的单一产品升级为综合解决方案,并面向酒店、社区等场景规模交付。

此外,其还与世茂集团成立合资公司,面向世茂集团下属的众多酒店批量交付智慧物联解决方案,为公司带来销售收入的快速增长。

而在医院场景,2016年,云知声与北京协和医院展开合作,率先在国内落地医疗病历转写解决方案,并在行业内被快速推广,目前已在100多家医院上线使用,超过500多家医院在测试使用。此外,云知声亦围绕智慧医疗需求,自主构建大规模医疗知识图谱,并据此推出病历质控系统、智能随访等产品,构建并完善医疗智慧物联解决方案,扩大在医院场景的影响力。

而聚焦云知声本次备战科创板的募资项目,也再次体现了公司对于技术能力、工程能力、产业能力持续深耕的发展目标。

招股书显示,云知声拟发行股份不超过2025万股,计划募集约9.12亿元,用于人工智能技术中台建设项目、面向物联网边缘计算的人工智能芯片研发平台建设项目、基于人工智能技术的智慧医院解决方案建设项目以及补充流动资金。

资本加持外,政策的利好似乎也预兆了云知声未来的发展机遇。日前发布的《中共中央关于制定国民经济和社会发展第十四个五年规划和二〇三五年远景目标的建议》中,“把科技自立自强作为国家发展的战略支撑”等表述再次引发行业热议。此外,“建议”中还指出,要瞄准人工智能、量子信息、集成电路、生命健康、脑科学等前沿领域,实施一批具有前瞻性、战略性的国家重大科技项目。

有业内人士对此评价道,技术、工程、产业三者复合,共同构成了云知声的AI全栈能力。不难想象,若成功登陆资本市场,云知声将持续保持技术和应用的领先性,进一步巩固核心竞争力,促进国内AI语音赛道进一步蓬勃发展。



[声明:本网注明“来源:XX(非聚马网、高校及产业创新服务平台)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点或其内容真实性,不承担此类作品侵权行为的直接责任及连带责任。其他网站或个人从本网转载原创文章时,须注明来源聚马网及作者。]

文章点评:

关键字: IPO  云知声  AI