可解釋人工智慧

可解釋人工智慧（英語：Explainable AI，縮寫為XAI）指的是讓專家能夠理解人工智慧之成果的方法與技術。它相對於黑箱式的機器學習，因為黑箱式的機器學習的設計者本身也無法解釋為什麼人工智慧能達到某些成果^[1]。可解釋人工智慧被認為是「要求解釋的權利（英語：right to explanation）」（right to explanation）的一種實踐^[2]。

要求人工智慧解釋它的決定是一種可解釋性問題（interpretability problem）^[3]。人工智慧的優化行為是一種為了滿足數理上特定目標的行為。其目標由設計者規劃，比如一個設計者要求「在資料集裡面精準分析電影如何被正面評價」。此時，人工智慧可能會找到一些通則，像是「評價中包含『爛』這個字眼表示是負面評價」。或是可能找到一些不正確的規則，比如「評價中包含『李小龍』這個字眼表示是正面評價」；這些規則可能難以解釋，甚至很可能在其他資料集得到錯誤的判斷，比如你很可能無法在《教父》的電影評價裡看到「李小龍」的字眼，但這不表示它是部爛片。針對這類問題，人類就能透過可解釋人工智慧的技術來監督人工智慧系統所找到的規則，並且判斷這些規則在真實的世界裡是否適用^[3]。

[1]

[2]

[3]

可解釋人工智慧

目的

監管法令

參考文獻

外部連結

Wikiwand - on