半个月前的锤子手机发布会,让包括妈妈在内的全国人民知道了一家叫科大讯飞的企业和语音智能的事情。
我不在现场。 据说罗先生向观众介绍了锤子的主要合作伙伴科大讯飞的产品输入法。 罗先生迅速说出了长拷贝,信息乱飞,毫无时差地完成了拷贝版。 同时,识别结果基本无偏差,完美无瑕,现场欢呼雀跃。
消息输入方式支持19种方言输入,与苹果的siri和微软的cortana相比,消息输入方式明显在本地化方面占了特点。
讯飞输入法背后的企业被称为科大讯飞,是目前国内最大的智能语音技术提供商。 第二天,科大讯飞的股价在开盘点迎来新高。 考虑到2008年科大讯飞上市以来股价持平,很多人说终于到了可以弥补的时候了。
除讯飞外,国内近几年内兴起了一系列致力于智能语音的创新企业,典型代表有思必驰、声智科技和云知声。
人工智能时代到来了,语音技术企业的春天又来了。 围绕雨后春笋般的ai的创业团队,智能语音技术的应用成为打开市场的主要选择,几乎每个月都会发布几款语音交互机器人。 除硬件外,语音服务平台也迅速建立。 键盘作为输入系统停留在前时代,人类用语言和机器进行交流。 智能家居和车载将成为语音产业最集中的领土,前面的爆炸市场也将诞生。
但是,高科技如何赚钱、如何赚钱是永恒的话题。 事实上,采访输入法、采访语言点和采访语音云只占采访总收入的3%左右,收入不到几千万。 根据路线,还有一件事。 科大讯飞每年收入20多亿美元。 大部分来源于网线的铺设和教育工程的整合,不是高精尖的智能语音技术。
上个月,在深圳举办的小型内部智能语音研讨会上,思必驰副总裁、声智科技创始人、以及来自峰瑞资本、祥峰投资的两位关注人工智能的早期投资者就语音技术如何赚钱进行了话题讨论。 正好我在现场,我觉得说得很好。 我觉得有些段落很棒。 于是录音记录和版权就来了,分享给大家。 这里可能有你想问的实话,实话。
深蓝季星
. 11.11
讨论客人
年高端智能手机问世后,短短几年内,国内出现了许多语音相关企业。 例如云知声、思必驰、科大讯飞,飞速发展非常迅速,很快就进入了公众的视野。 这也是因为随着手机这个智能终端的迅速发展,语音已经成为手机上重要的APP应用。
年,我们认为语音仍然是一个非常好的投资机会。 其理由首先是,过去2~3年,由于人工智能的迅速发展,语音技术取得了很大的进步,但实际精度还不够高。 实验数据表明,精度据说达到了95%以上,但实际采用后并不高,这是现实。
暂且不谈算法和技术方面,前端的很多问题还没有得到处理。 让我举一个最简单的例子。 过去我们讨论的语音识别技术,就像人脑听到声音后,我们如何翻译,如何把它变成大脑可以理解的新闻一样。 但是,实际上,关于耳朵的问题,还没有处理如何排除噪声干扰的问题吗? 怎么听多人说话时想听的文案? 怎么在距离远的时候区分各个声音的方向? 如果前端语音/音响交互的很多问题没有得到处理,整体体验总是不够。
二是从数据来看,苹果语音搜索的采用率其实并不高。 其理由是,虽然手机不是键盘,但是触摸屏的体验很好。 快速发展的前景在于智能硬件。 手机之后,家庭、车载、可穿戴设备、机器人等众多智能终端爆炸,这些智能终端搭载的键盘和手指变得更不重要,不友好,声音变得更重要。
大语音智能后视镜在司机与机器沟通的过程中,可以随时中断机器的谈话,让机器执行其他任务,让机器做暂时想做的事。 解放双手,可以让驾驶更安全。
从以上两点来看,我们认为语音技术会越来越迅速发展和进步。
关于语音技术,大家其实一直面临着一个问题,怎么赚钱? 科大讯飞收入20多亿,其中大部分都是铺网线、做项目工程,尖端科技类其实不赚钱。
在线上,我们本来可以提供api赚钱,但是之后百度就免费了,其他人也只能免费了。 如果制作APP去对接服务的话,会被认为手机顾客的习性、行为方式还没有确立。 所以我想听听大家对这个非常现实的问题的看法。
这个问题很好,也不能简单地回答。 对思驰来说,我们现在在考虑怎么烧钱,不考虑怎么赚钱。 这个事件确实很难。
从电脑、互联网到移动网络,再到其他,你会发现语音很可能是一个方向。 语音是一种方便的交互式方法,随着智能硬件设备的反复更新,语音有可能取代触摸面板成为交互式模式。 所以,资本和技术聚焦于这一部分,人工智能的小春天在冬天里诞生了。
这个事件,目前我们看不清楚。
但以这个方向为中心,一个是核心技术和产品体验的提高,这是必要的。 第二,我相信大部分企业将来都会拥有比较多也不少的技术许可费等。 但是,这部分不足以满足资本诉求。
但是,不管未来是2c还是2b,我相信在这个环节大家都在探索。 这条路径是曲折的,但方向一定是正确的。
首先简单介绍一下祥峰投资。 我们在新加坡淡马锡旗下的vc,首要关注的是费用和技术行业的中早期投资,在人工智能方向投资了地平线、maxent等。 从投资方的角度简单地陈述意见。
要想看到赚钱的方法,找到诉求地点是最好的。 在看到这么多创业项目后,我们将思考在中国的费用生态下,企业是如何赚钱的。 其实核心是抓住客户真正的诉求点,从诉求点出发,思考如何做产品,追溯到你的上游,到顶层,甚至芯片,找到哪里有机会。
首先,在手机端,语音作为输入方法是有诉求的,正如刚才大家所说,现在想用手机做语音识别的技术,提供输入方法,用输入方法做APP收钱。 这显然是今天不可能的事件。 即使现在,也没有像百度输入法那样的键盘输入那样的APP。
就算声音是不同的输入方法,也很难收钱。 特别是大佬们已经做的时候了。 这个时候,必须找到诉求场景。 同时,没有其他声音场景能和你竞争发挥重要作用。
例如,智能家居中的扬声器就是一个很好的例子。 不能触摸扬声器或用其他键盘输入。 因此,如果你找到与扬声器对话的方法,显然你是最好的,因为没有其他强大的替代者。
那就要谈车了。 其实,在汽车中,多年来大家采用的旋钮和按钮,本身就是非常好的人机交互方法,并不一定比语音输入效率低,反而效果更好。 因为可以进行百叶窗操作。 想象一下,在车里想换收音机的时候,不看中控台也能触摸旋钮进行操作。 或者方向卡上有旋转的车轮,可以调整音量之类的。 这已经是最好的人机交互方式了。 用声音提高音量和切换频率并不一定更直接和准确。
但是,车里还有很多其他的用旋钮无法应对的指控。 例如。 现在后部的乘客需要和车进行交流,很多车都有后部独立的空调整系统。 后部的温度太低,感觉想把空调高的时候,现在的情况下只能让驾驶员把后部的空调高,或者后部自己调高,但那不一定是自动的方法。
如果可以做到这一点,使用优秀的语音识别阵列工具,可以很好地分辨不同乘客的方向是主驾驶还是副驾驶,以及后排的左侧还是右侧,根据他们发出的语音指令满足不同人的诉求,从而产生新的对话方法。 除了空的调以外,也有切换收音机、改变歌曲等诉求。
从产业链上游来看,这几年芯片一直是个能赚钱的事件。 在语音识别这一块,iphone采用的类似cirrus logic的语音解决芯片,语音解决这一块的算法做得非常好,处理了语音降噪、方位识别上的重要问题。 如果芯片作为运营商,你可以根据以前流传下来的芯片商业模式赚钱。
照片是echo dot,那个场景不是用来听歌的,是语音助手。
例如机器人,现在还没有被普遍采用,但一定是有趋势性、未来性的。 家庭场景中,最广泛采用的其实是扫地机器人。 大部分人不一定买了一会儿再用扫地机器人。 其中有很多理由。 可能打扫得不够。 另外,也有不聪明的理由。 那是因为完全没有计划路线就在打扫。 如果能参与越来越多智能的东西,包括语音交流,那就有可能成为真正的智能机器人。 扫地机器人,到我这里来,打扫这个房间。 不是拿着遥控器来操作,也不是走路来拿。 一旦你的声音传到他那里,他就会知道你的方向,自动朝你的方向走。 这也是提高顾客体验的方向。
为什么说语音技术赚不到钱? 其实一开始商业模式构建得不是很好。 刚开始提供云识别,是to vc的模式,强调企业的企业品牌影响很大。 那个一旦开了免费的洞,之后就不能收钱了。
我们现在想和大家商量把蛋糕做大,然后怎么分蛋糕。 但是现在整个市场还没有发生,做语音技术的人在烧钱。
声音技术的开始有点特殊。 我从一开始就在做硬件。 看了很多展示的产品,有我们有许可证的,也有我们自己从硬件直接收入的。 相对来说,我们最初的商业模式非常简单。
电影《her》的海报。 电影主角爱上了他智能设备语音识别系统发出的声音。 电影预言:在未来,人们离不开基于语音识别技术的智能系统。
我们现在有一点收入,今后我们在里面怎么能产生更好的方法呢? 对我们来说,是硬件+芯片。 这样以后可以产生更好的收入。 移动终端有很多ap、很多大企业,但这将会产生什么样的新商业模式,也许还在探讨和探索中。
现在很多大公司不需要考虑收益,所以尽可能做。 对我们来说,只有先有硬件,再加上轻便的方法,来维持企业的正常业务运营。 然后,下一步,正如我们预想的那样,看看语音是否能引发新一代的搜索门户,甚至门户战争,从而形成新的商业模式,改变我们的许多行为方式。 这需要各方面的探讨和探索,有时也会掉进很多坑里。
我相信第一波会有很多企业加入。 正如人们常说的,因为第二波企业行得通。 任何时代的快速发展都经常出现这种情况。 关于定位,我们也无话可说,但首先提供完善的处理方案,无论是机器人、智能音响还是车载,我们都希望能开拓这个市场。 而且,我们自己也非常开放地合作着。
来源:UI科技日报
标题:“人工智能时代 语音技术如何赚钱?”
地址:http://www.ulahighschool.com/uiitzx/361.html