語音可延伸標記語言(英語:Voice Extensible Markup Language,簡稱VoiceXML 或 VXML)是於互動式語音回應應用程式建立音頻對話的標準,用於開發音頻及聲音回應應用程式,例如銀行系統及自動客戶服務。來自網頁伺服器的超文字標記語言(HTML)被網頁瀏覽器接收後,網頁瀏覽器能對其進行解析並視覺呈現出來,VoiceXML應用程式的開發及部署也類似這方式。VoiceXML文件由語音瀏覽器解析。於一般的部署架構之下,用戶通常經由公共交換電話網(PSTN)跟語音瀏覽器互動。VoiceXML文件以XML為基礎,是由萬維網聯盟(W3C)開發的標準。
用法
VoiceXML應用程式於各行業及商業領域廣泛使用,包括訂單查詢、包裹追蹤、駕駛方向、緊急通知、喚醒、航班跟蹤、語音存取電子郵件、客戶關係管理、還按原方抓藥、音頻新聞雜誌、語音撥號、房地產資訊和國家目錄援助等。 VoiceXML的標籤能指示語音瀏覽器提供語音合成、自動語音辨識、對話管理和音頻播放。下面是一個VoiceXML文件的例子:
<vxml version="2.0" xmlns="http://www.w3.org/2001/vxml">
<form>
<block>
<prompt>
Hello world!
</prompt>
</block>
</form>
</vxml>
當一個VoiceXML解析器解析該文件時,「Hello world」字句將以語音合成方式讀出。
通常情況下,HTTP被用作獲取VoiceXML頁面的傳送協定。一些應用程式可能使用靜態的VoiceXML頁面,而依靠動態的VoiceXML作頁面生成的應用程式則需使用應用程式伺服器,例如Tomcat、WebLogic、IIS或WebSphere。
從歷史上看,VoiceXML的平台供應商以各種不同方式執行其標準,並添加專有產品特點。但是,VoiceXML 2.0標準於2004年3月16日被採納為W3C推薦標準,闡明了大部分的差異之處。VoiceXML討論區為推廣標準用途的產業群,它提供了一個一致性測試過程,以證明供應商的執行方式的一致性。
歷史
為了開發一個用於語音對話的標準標記語言,美國電話電報公司、IBM、朗訊科技及摩托羅拉於1999年3月構成了VoiceXML討論區。同年9月,他們於討論區開放會員留言功能,並於2000年3月發佈了VoiceXML 1.0。不久後,他們把標準的控制權移交至W3C。[1]其後W3C生產了數個中間版本,並於2004年3月生產了最終推薦階段的VoiceXML 2.0。[2]
基於VoiceXML 2.0的反饋,VoiceXML 2.1 (頁面存檔備份,存於互聯網檔案館)的新增功能相對較少。VoiceXML 2.1能向下相容VoiceXML 2.0,並於2007年6月達致W3C推薦階段。[3]
將來發展
VoiceXML 3.0 (頁面存檔備份,存於互聯網檔案館)將會是VoiceXML的下一個主要發行版,包含新的主要特點。它包含一個新的XML狀態圖描述語言,名為SCXML。
參考文獻
外部連結
參見
Wikiwand in your browser!
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.