虚拟助理(virtual assistant)是一种能替个人执行任务或服务的软件代理(software agent)。有时候“聊天机器人”泛指虚拟助理,亦或专指网络聊天使用的软件机器人(有时候更专指娱乐而非实用的网络聊天)。但也可以指一种职业,或者企业组织,其乃是透过网络执行远端服务。[1]其能依据使用者输入的内容、位置感测而完成相对应的任务或提供相关服务,同时也具有从网络上寻找并提供使用者各种资讯(像是天气交通状况、新闻股市行情、行程零售价格等)的能力[2]

Thumb
Android 智能手机Google个人助理
Thumb
苹果电视的遥控器,使用者可请虚拟助理 Siri 找寻要观赏的内容
Thumb
Amazon Echo 智慧扬声器使用 Amazon Alexa 虚拟助理

至2017年,随着新产品进入市场,虚拟助理的功能与运用正快速扩张。一项2017年5月的线上调查显示,美国市占率依次为苹果 Siri(34%)、Google个人助理(19%)、Amazon Alexa(6%)及微软Cortana(4%)。[3]搭载这些助理的智慧扬声器英语smart speaker也有着巨大的变化;苹果直到2017年6月才宣布其智慧扬声器。脸书的 M虚拟助理英语M (virtual assistant) 预计2017年在 Facebook Messenger 上会有数亿的用量。[4] 大量的智能手机用户安装了苹果和 Google的助理,微软则是在视窗的PC上 (Cortana也可安装于手机和智慧扬声器);Amazon Alexa 则是首先具备线上订购的功能。[4]

历史

最早具备数位语音识别功能的工具是 IBM Shoebox英语IBM Shoebox,在1962年西雅图世界博览会向民众发表。这个早年的电脑开发比IBM个人电脑早20年,能够识别16个字以及数字0到9。语音识别的下一个里程碑出现于1970年代的卡内基美隆大学,受到美国国防部及国防高等研究计划署(DARPA)大力支持。其工具“Harpy”能够驾驭约一千字——三岁儿童的字汇。大约十年后,同一个科研团队,利用隐马尔可夫模型开发了不但能分析单一的字而且是连串词的系统。[5] 因此早期运用语言识别的虚拟助理是自动总机英语automated attendant与医疗数位答录英语digital dictation软件。[6] 1990年代,数位语音识别技术成为微软、IBM、飞利浦等个人电脑厂商争取消费者的一个卖点。之后市场于1994年推出第一个智能手机IBM Simon,为我们现在认知的智能虚拟助理奠下基础。[7] 第一个安装于智能手机上的现代数位虚拟助理是Siri——iPhone 4S 2011年10月4日引进的新功能。[8] 苹果公司在2010并购Siri公司后开发Siri。Siri公司是美国国防部及国防高等研究计划署出资成立的SRI International旗下的衍生公司。[5]

互动方式

虚拟助理的作业媒介:

  • 文字(网络聊天),尤其是即时通讯等的应用程序。
  • 语音,例如 Amazon Echo上的Alexa 或是iPhone上的Siri 。
  • 利用照相或上传图像,例如三星 Galaxy S8 上的 Bixby。

有些虚拟助理的使用方式多样,例如Google智能助理Google Allo app 用文字,Google Home 智慧扬声器则用语音。

虚拟助理利用自然语言处理(NLP)从使用者的文字、语音输入,找到相应的可执行指令。许多助理利用人工智能的技巧,包括机器学习,不断学习。

用语音启动虚拟助理,可能需要用到“唤醒词”(wake word),这是一个或一组词,例如 Alexa 、Siri或者 OK Google。[9]

服务

虚拟助理可提供多样的服务,尤其是 Amazon Alexa 和 Google 个人助理,日新月异,包括:[10]

  • 提供资讯,例如气象、来自维基百科IMDB的事实,设定闹钟、待办事项、购物清单。
  • 播放串流服务的音乐例如 Spotify 和 Pandora,播放广播或有声书。
  • 从串流服务例如 Netflix,在电视上播放影片、电视节目或电影。
  • 购物,例如从 Amazon。
  • 辅助或者取代真人客服。[11] 一项报告估计,自动线上助理减低客服中心人员的工作负荷达30%。[12]

第三方应用程序

Amazon Alexa 的“Skills”、Google 的“Actions”,Apple 的“SiriKit”让第三方应用程序能够在助理平台上执行。

开发者平台

广泛使用的虚拟助理的平台也可用于解决其他的问题:

  • Amazon Lex英语Amazon Lex 2017年4月开放给开发者使用,发表于2016年11月,包含自然语言理解技术结合自动语音识别。[13]
  • Google 提供开发者 Actions on Google 以及API.ai 平台,以便制作Google个人助理的"Actions" 。[14]
  • 苹果提供 SiriKit,让开发者制作 Siri 的延伸套件。
  • IBM 的华生(Watson)虽然有时被称为虚拟助理,实际上是全面的 人工智能平台及社群,提供虚拟助理、聊天机器人以及其他许多解决方案。[15]

早期的助理

前代文字聊天为主的虚拟助理,通常有个代表的头像(avatar也称为“线上互动人物”或“自动化的人物”)——这叫做具体化的代理英语embodied agent

各型助理列表

More information 虚拟助理, 开发者 ...
虚拟助理 开发者 自由软件 开源硬件 HDMI 输出 外接 I/O 物联网 Chromecast 整合 智能手机 app 一直执行 个别相连的音频
Assistant Speaktoit 不适用 不适用 不适用 不适用
Alexa (a.k.a. Echo) Amazon.com ?
Bixby 三星电子 不适用 不适用 不适用 不适用 不适用 不适用 不适用 不适用
BlackBerry Assistant 黑莓 不适用 不适用 不适用 不适用
Braina Brainasoft 不适用 不适用 不适用 不适用
Cortana 微软 不适用 不适用 不适用 不适用
Evi Amazon.com True Knowledge 不适用 不适用 不适用 不适用
Google个人助理 Google 不适用 不适用 不适用 不适用
Google Now Google 不适用 不适用 不适用 不适用
M Facebook
Mycroft[16] Mycroft AI
Sherpa Sherpa Europe SL 不适用 不适用 不适用 不适用
SILVIA Cognitive Code 不适用 不适用 不适用 不适用
Siri Apple Inc. 不适用 不适用 不适用 不适用
Lucida
Template:Third party inline
? 不适用 不适用 不适用 不适用
Viv 三星电子 不适用 不适用 不适用 不适用
Nina Nuance
Close

经济关联

虚拟助理赋予的数位经验,被视为近来一种最主要的技术跃进,也是最有前途的消费趋势。专家声称,数位经验可以达到与真实经验同等的分量,甚至更被追求,更为看重。 [17] 这个趋势被证实于大量的经常使用者以及全球虚拟助理使用人数的巨幅增长。2017年中, 数位虚拟助理的经常用户数目,全世界估计在十亿左右。[18] 此外可以观察到,虚拟助理技术不再限于智能手机的应用,而是跨及不同产业(包括汽车、电信、零售、医疗、和教育)。[19]

参见

参考资料

Wikiwand in your browser!

Seamless Wikipedia browsing. On steroids.

Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.

Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.