虚拟助理(virtual assistant)是一种能替个人执行任务或服务的软件代理(software agent)。有时候“聊天机器人”泛指虚拟助理,亦或专指网络聊天使用的软件机器人(有时候更专指娱乐而非实用的网络聊天)。但也可以指一种职业,或者企业组织,其乃是透过网络执行远端服务。[1]其能依据使用者输入的内容、位置感测而完成相对应的任务或提供相关服务,同时也具有从网络上寻找并提供使用者各种资讯(像是天气、交通状况、新闻、股市行情、行程或零售价格等)的能力[2]。
至2017年,随着新产品进入市场,虚拟助理的功能与运用正快速扩张。一项2017年5月的线上调查显示,美国的市占率依次为苹果 Siri(34%)、Google个人助理(19%)、Amazon Alexa(6%)及微软Cortana(4%)。[3]搭载这些助理的智慧扬声器也有着巨大的变化;苹果直到2017年6月才宣布其智慧扬声器。脸书的 M虚拟助理 预计2017年在 Facebook Messenger 上会有数亿的用量。[4] 大量的智能手机用户安装了苹果和 Google的助理,微软则是在视窗的PC上 (Cortana也可安装于手机和智慧扬声器);Amazon Alexa 则是首先具备线上订购的功能。[4]
历史
最早具备数位语音识别功能的工具是 IBM Shoebox,在1962年西雅图世界博览会向民众发表。这个早年的电脑开发比IBM个人电脑早20年,能够识别16个字以及数字0到9。语音识别的下一个里程碑出现于1970年代的卡内基美隆大学,受到美国国防部及国防高等研究计划署(DARPA)大力支持。其工具“Harpy”能够驾驭约一千字——三岁儿童的字汇。大约十年后,同一个科研团队,利用隐马尔可夫模型开发了不但能分析单一的字而且是连串词的系统。[5] 因此早期运用语言识别的虚拟助理是自动总机与医疗数位答录软件。[6] 1990年代,数位语音识别技术成为微软、IBM、飞利浦等个人电脑厂商争取消费者的一个卖点。之后市场于1994年推出第一个智能手机IBM Simon,为我们现在认知的智能虚拟助理奠下基础。[7] 第一个安装于智能手机上的现代数位虚拟助理是Siri——iPhone 4S 2011年10月4日引进的新功能。[8] 苹果公司在2010并购Siri公司后开发Siri。Siri公司是美国国防部及国防高等研究计划署出资成立的SRI International旗下的衍生公司。[5]
互动方式
虚拟助理的作业媒介:
- 文字(网络聊天),尤其是即时通讯等的应用程序。
- 语音,例如 Amazon Echo上的Alexa 或是iPhone上的Siri 。
- 利用照相或上传图像,例如三星 Galaxy S8 上的 Bixby。
有些虚拟助理的使用方式多样,例如Google智能助理在Google Allo app 用文字,Google Home 智慧扬声器则用语音。
虚拟助理利用自然语言处理(NLP)从使用者的文字、语音输入,找到相应的可执行指令。许多助理利用人工智能的技巧,包括机器学习,不断学习。
用语音启动虚拟助理,可能需要用到“唤醒词”(wake word),这是一个或一组词,例如 Alexa 、Siri或者 OK Google。[9]
服务
虚拟助理可提供多样的服务,尤其是 Amazon Alexa 和 Google 个人助理,日新月异,包括:[10]
Amazon Alexa 的“Skills”、Google 的“Actions”,Apple 的“SiriKit”让第三方应用程序能够在助理平台上执行。
开发者平台
广泛使用的虚拟助理的平台也可用于解决其他的问题:
前代文字聊天为主的虚拟助理,通常有个代表的头像(avatar也称为“线上互动人物”或“自动化的人物”)——这叫做具体化的代理。
各型助理列表
虚拟助理 | 开发者 | 自由软件 | 开源硬件 | HDMI 输出 | 外接 I/O | 物联网 | Chromecast 整合 | 智能手机 app | 一直执行 | 个别相连的音频 |
---|---|---|---|---|---|---|---|---|---|---|
Assistant | Speaktoit | 否 | 不适用 | 不适用 | 不适用 | 否 | 否 | 是 | 否 | 不适用 |
Alexa (a.k.a. Echo) | Amazon.com | 否 | 否 | 否 | 否 | 是 | 否 | 是 | 是 | ? |
Bixby | 三星电子 | 否 | 不适用 | 不适用 | 不适用 | 不适用 | 不适用 | 不适用 | 不适用 | 不适用 |
BlackBerry Assistant | 黑莓 | 否 | 不适用 | 不适用 | 不适用 | 否 | 否 | 是 | 否 | 不适用 |
Braina | Brainasoft | 否 | 不适用 | 不适用 | 不适用 | 否 | 否 | 是 | 否 | 不适用 |
Cortana | 微软 | 否 | 不适用 | 不适用 | 不适用 | 是 | 否 | 是 | 是 | 不适用 |
Evi | Amazon.com True Knowledge | 否 | 不适用 | 不适用 | 不适用 | 否 | 否 | 是 | 否 | 不适用 |
Google个人助理 | 否 | 不适用 | 不适用 | 不适用 | 是 | 否 | 是 | 是 | 不适用 | |
Google Now | 否 | 不适用 | 不适用 | 不适用 | 是 | 是 | 是 | 是 | 不适用 | |
M | ||||||||||
Mycroft[16] | Mycroft AI | 是 | 是 | 是 | 是 | 是 | 是 | 是 | 是 | 是 |
Sherpa | Sherpa Europe SL | 否 | 不适用 | 不适用 | 不适用 | 是 | 否 | 是 | 是 | 不适用 |
SILVIA | Cognitive Code | 否 | 不适用 | 不适用 | 不适用 | 否 | 否 | 是 | 否 | 不适用 |
Siri | Apple Inc. | 否 | 不适用 | 不适用 | 不适用 | 是 | 否 | 是 | 是 | 不适用 |
Lucida Template:Third party inline |
? | 是 | 不适用 | 不适用 | 不适用 | 否 | 否 | 是 | 否 | 不适用 |
Viv | 三星电子 | 否 | 不适用 | 不适用 | 不适用 | 是 | 否 | 是 | 否 | 不适用 |
Nina | Nuance | 否 |
经济关联
虚拟助理赋予的数位经验,被视为近来一种最主要的技术跃进,也是最有前途的消费趋势。专家声称,数位经验可以达到与真实经验同等的分量,甚至更被追求,更为看重。 [17] 这个趋势被证实于大量的经常使用者以及全球虚拟助理使用人数的巨幅增长。2017年中, 数位虚拟助理的经常用户数目,全世界估计在十亿左右。[18] 此外可以观察到,虚拟助理技术不再限于智能手机的应用,而是跨及不同产业(包括汽车、电信、零售、医疗、和教育)。[19]
参见
参考资料
Wikiwand in your browser!
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.