搜狗知音app是一款主打语音交互技术的手机搜索引擎,app可以做到识别速度更快、纠错能力更强、支持更加复杂多轮的交互以及更加完善的服务能力。搜狗知音app技术致力于让人机交互更加自然,不仅能听会说,搜狗知音app还具有能理解会思考的能力。
软件介绍
搜狗知音app是一款来自搜狗官方的语音交互引擎应用,搜狗知音app旨在把搜狗语音助手打造的更加智能,达到“能理解会思考”的程度,通过搜狗知音app可解决语速过快导致的吞音、纠错、对用户真实意图的识别等问题,搜狗知音app引擎使用着互联网上规模最大的语音数据,在线语音输入日请求规模超过了1.4亿,每天用户产生出来的语料规模是11.7万小时,如此庞大的数据帮助搜狗大幅提升了语音识别的准确率。
软件特色
心急如焚的你要赶往机场,语音助手却偏和你唱反调。你降低语速,反复说了几遍,它才明白你要去哪,最终却导向了错误的航站楼。语音助手 “不智能”、没帮助的痛点,即是搜狗“知音”想要解决的。
搜狗发布了新的智能语音引擎“知音”,宣称要把搜狗语音助手打造的更加智能,达到“能理解会思考”的程度。对此,CTO 杨洪涛和语音负责人王砚峰登台进行详细介绍。
“知音”想解决的第一个痛点是语速过快导致的吞音问题。当你讲话过快时,很多语音助手会因为音节的模糊而发生识别错误。而搜狗称,“知音”的识别速度与前代相比可以提升 3 倍,而错误率则可以下降约 30%。
在发布会上,搜狗全程使用了它们的实时转写技术。二位主讲全程都没有故意放慢语速,而“知音”实时投放在大屏幕上的字幕,则保持着还算不错的准确度。当然,用词错误的情况还是无法避免的。
此外,“知音”想解决的第二个痛点是纠错问题。我们通常用语音输入文字,由于识别不清,免不了要换回键盘继续再修改错别字。搜狗为了让语音识别彻底摆脱键盘,允许你通过语音进行修改。
比如,根据王砚峰的介绍,你可以直接告诉语音助手:把弓长“张”换成立早“章”,或者,把山峰的“峰”换成烽火的“烽”,语音助手就会自动为你修改。
搜狗称,能实现这一点,与现有业务的数据储备是分不开的。搜狗输入法的词库、拆字库、用户的语料库,以及百科知识图谱,都为“知音”的识别能力提供了数据支撑。
而“知音”想要解决的第三个痛点则是对用户真实意图的识别。为此,他们为“知音”加入了一个多轮对话的功能。
根据搜狗在现场的演示视频,当你告诉“知音”你的目的地是首都国际机场时,知音不会马上为你规划路线,而是会进行对话。它会询问你要去的航站楼、航班号,问你直接去航站楼,还是停车场,一切确定之后才会生成导航路径。
这种场景会话能力与 Google 今年在 I/O 上介绍的以对话为基础的新语音功能类似,会结合你之前问过的问题提供信息,而不是让这个过程变成机械的一问一答。
王砚峰称,机器的语义理解在 5 年内将不会有太大突破,当前的技术水平不足以支撑问题难度,因此机器想具有人的理解能力还有很大距离。
深谙这个道理的搜狗,选择搁置技术瓶颈,利用现有服务的数据,结合用户各种使用场景,希望让语音助手达到真正对用户有帮助,而不是制造更多麻烦。
杨洪涛认为,只有真正考虑用户的使用场景,才能帮助语音平台积累数据,最终达到数据反哺机器学习技术的效果。
最新动态
近日,搜狗推出新一代人机交互——“唇语识别”,顾名思义,就是能识别人的唇部动作,来解读说话者所说的内容。
搜狗表示,通过复杂端到端深度神经网络技术进行中文唇语序列建模,经过数千小时的真实唇语数据训练,终于取得了唇语识别效果。
在非特定人开放口语测试集上,该系统达到60%以上的准确率,超过google发布的英文唇语系统50%以上的准确率。在垂直场景如车载、智能家居等场景下甚至已经达到90%的准确率。
未来唇语识别技术可以辅助语音交互及图像识别,日常周围噪音过大或不便发声的场所更加适用,既能保证识别准确性和稳定性,也可以保证说话内容的私-密性。
此外,唇语识别技术可以帮助公安人员获取无声视频中重要的讲话信息,还能帮助先天性听障人群。