11月23日,科大讯飞在该年度新产品战术发布会上发布了声音的编辑功能。 据笔者介绍,国内人工智能指导公司Sogou企业于今年6月11日在Sogou输入软件iphone3.8. 1版中成功实现了该功能,讯飞比Sogou晚了近半年。
Sogou首次语音编辑时隔半年进行了随访
选择语音输入时,周边环境、口音、说话速度可能会影响语音识别的正确性。 一旦识别错误,整个词的意思有可能发生变化。 虽然可以改装,但还是需要双手配合,在驾驶中和其他特殊场合并不容易实现。 本来是聪明的服务,但顾客体验似乎并没有提高很多。
为了解决这个问题,Sogou语音提供了自己的语音编辑功能。 客户可以用纯自然语言纠正错误。 打开Sogou输入软件,点击声音编辑功能,就可以一边说话一边多次编辑已经输入的副本。
照片:强大到难以想象的声音编辑
例如,一起去吃饭之前今晚加8点;
例如,将晓文的晓字变为大小较小的;
例如,删除某个词;
例如,将天津改为北京;
比如,在好字前面加上你;
例如,饭后打个问号,
照片: Sogou的声音编辑功能支持各种简单易用的命令
能够实现这种智能互动的,越来越多的不是语音识别,而是语义理解。 准确的语义理解需要应用基于深度学习的人工智能技术,而人工智能基于大数据、云计算、机器学习,各大搜索引擎天生就是这三个行业中最核心的技术载体。 比起飞行,像Sogou这样的互联网企业,特别是搜索企业更具有明显的天然特征。 据了解,目前Sogou的语音编辑功能支持的语法数量达到3万多种。
目前,智能语音领域继续火热。 语音识别技术也已成熟,并趋于实用化。 领域内的识别精度一般达到97%,在向上突破仍存在较大瓶颈的情况下,各语音制造商开始寻找其他方法,使语音交流更加智能自然。 在这一点上,Sogou的声音显然已经走在了前面,保持着领先地位。
来源:UI科技日报
标题:“搜狗首创语音撰改 时隔半年讯飞跟进”
地址:http://www.ulahighschool.com/uiitzx/277.html