优点点语音智能-智能语音交互,情感认知该如何突破?

浏览数:178 

人工智能,今年非常火热。作为新兴技术产业之一,人工智能首次被写入今年的政府工作报告。这无疑是向以人工智能为代表的新兴技术加速产业化落地应用,发了一个大大的“政策红包”。

  智能语音交互服务是人工智能领域较早大规模商业化的领域,其在智能家居的技术应用层出不穷。作为人机交互的主要入口之一,语音识别正试图突破情感认知难题,在家庭应用中普及。

  理解用户意图——智能语音交互服务核心

  日前,国内首份智能家居领域语音交互界面服务体验标准在京正式发布,该标准由京东与科大讯飞共同出资成立的一家高科技公司“灵隆科技”完成。

  得益于科大讯飞和京东的技术与平台支持优势,灵隆科技已推出“叮咚智能音箱”等多款语音交互产品。该公司研发中心负责人周正友介绍说,这份标准是基于叮咚长期的用户体验反馈、修正和不断优化制作完成。

  “它不仅对语音交互产品体验有重要的指导性意义,同时对于未来将接入语音交互接口的第三方服务和内容行业也有着重要意义,能够帮助他们以最快的速度和最简洁的方法接入语音交互接口,实现用户体验最优化。”

  周正友认为,理解用户意图是智能语音交互的核心。与界面交互不同的是,在语音交互过程中往往是“多对一”的指令。也就是用户的同一种意图,有可能以多种不同形式提出。这就要求语音交互必须大量学习人们的日常语言习惯,甚至做到理解用户的语义的“弦外之音”。

  “我们这份标准强调了理解用户意图是语音交互服务的核心,目前可以识别同样的意图下不同地域、文化、性别的表达习惯用语和词组。”周正友表示,该标准进一步明确了人机交互的反馈流程和设计标准。它定义了两个智能语音交互的关键指标——语音和意图,通过语义和意图的转化来完成交互的核心步骤。

  人机交互入口——语音识别技术更实用化

  现如今,语音识别与图像识别变得更加实用。通过语音控制,家庭用户能够以较低的成本实现随时访问和互动。从理解用户意图到反馈并提供服务,现有模式繁杂的语音交互产品中,技术差别能有多大?语言的差异能否影响产品功能体验?

  据悉,作为国内早期支持全语音交互的智能音箱产品,叮咚智能音箱通过不断迭代和丰富产品线,根据不同用户的使用习惯去定制个性化的服务。灵隆科技第三方开放平台技术工程师操灿介绍说,叮咚的目标是向航空服务业看齐,包含通用、自然、快捷三个主要部分。

  “我们希望在用户使用产品呼叫服务或内容时候,能够最快理解用户意图,反馈并提供服务。从而去建立完整的智能语音交互生态。”操灿表示,叮咚音箱接下来将依托开放的云平台,加强第三方服务合作力度,不断升级产品和优化用户体验,让用户真正感受到语音交互的自然和便利。

  拥有较高技术壁垒的智能语音技术,被视作为人机交互的入口。分析人士认为,与智能家居、可穿戴设备、机器人等产品应用的交互模式,语音将是未来最佳的人机交互模式。随着人工智能深度学习的发展,语音交互的逻辑将在智能家居领域逐步兑现。

  情感认知突破——人工智能需要应用创新

  尽管人工智能并未刻意追求和人类完全一样的智能,但它的发展毫无疑问能让机器拥有更高的智能化水平。过去的20余年,人工智能已经在很多方面超越了人的能力。科学家们致力于用人工智能帮助人类,延伸人的能力,包括情感认知上的突破。

  当前,国内人工智能技术在应用层面主要聚焦于计算机视觉、语音识别和语言技术处理领域,代表企业包括科大讯飞、百度阿里巴巴腾讯等。我国人工智能领域的研究积累和发达国家相比差距并不大。

  中国协会大数据分会副会长刘鹏认为,企业对外开放了自身的人工智能系统,并不代表核心技术和算法的完全出让。底层系统的开放,可以让更多的企业或社会团体从不同的角度参与到人工智能相关领域的研发。

  基础技术、开放平台、应用芯片,人工智能的未来发展,政府亦扮演者重要角色,首当其冲是要培育人工智能发展的产业环境。“在目前对人工智能技术的大量讨论中,承载人工智能运行的芯片技术容易被忽略。未来,人工智能的竞争重点将在机器学习领域,包括监督学习、非监督学习和增强学习三个方面,算法的竞争将会进入白热化阶段。”刘鹏称。