提示工程(Prompt engineering)是人工智能中的一個概念,特別是自然語言處理(NLP)。 在提示工程中,任務的描述會被嵌入到輸入中。例如,不是隱含地給予模型一定的參數,而是以問題的形式直接輸入。 提示工程的典型工作方式是將一個或多個任務轉換為基於提示的數據集,並通過所謂的「基於提示的學習(prompt-based learning)」來訓練語言模型。[1][2] 提示工程可以從一個大型的「凍結」預訓練語言模型開始工作,其中只學習了提示的表示方法,即所謂的「前綴調整(prefix-tuning)」或「提示調整(prompt tuning)」。[3][4] 語言模型GPT-2和GPT-3[5]是提示工程的重要步驟。
歷史
2021年,使用多個NLP數據集的多任務提示工程在新任務上顯示出良好的性能。[6] 在小樣本學習的例子中,包含思維鏈的提示在語言模型中顯示出更好的推理能力。[7]零樣本學習中,在提示中預留鼓勵思考鏈的語句(如「讓我們一步一步地思考」)可能會提高語言模型在多步驟推理問題中的表現。[8]這些工具的廣泛可及性由幾個開源筆記和社區主導的圖像合成項目的發佈所推動。[9]
一份關於處理提示的描述報告稱,在2022年2月,約有170個數據集的2000多個公共提示可用。[10]
2022年,DALL-E、Stable Diffusion、Midjourney等機器學習模型得到公開發布。這些模型以文本提示為輸入,並使用其生成圖像,這影響了一個與文生圖提示有關的新品種提示工程。[11]
文字到文字
思路鏈(Chain-of-thought)(CoT) 是文字提示(Textual prompting)的一種技術,該技術通過提示 LLM 生成一系列中間步驟來提高 LLM 的推理能力,這些中間步驟會導致多步驟問題的最終答案。[12] 該技術由谷歌研究人員於 2022 年首次提出。[13][14]
提示連結(Prompt chaining)是一種在對話式AI中文本提示使用的一種技術,用於創建更具動態性和上下文感知的聊天機械人。它涉及使用一個提示的輸出作為下一個提示或對話的一部分的輸入。通過將提示連結在一起,您的對話助手可以更輕鬆地適應您沒有設計的情況,同時保持良好的對話。[15][16]
文字到圖像
2022 年,DALL-E 2、Stable Diffusion 和 Midjourney 等文本到圖像模型向公眾發佈。[17]
文字到影片
文本到影片生成 (TTV) 是一項新興技術,可以直接根據文本描述創建視頻。這個新穎的領域具有顯着改變視頻製作、動畫和故事講述的潛力。通過利用人工智能的力量,TTV 允許用戶繞過傳統的視頻編輯工具,將他們的想法轉化為移動圖像。
非文字提示
一些方法用非文本輸入來增強或替換自然語言文本提示。
提示注入
提示注入(英語:Prompt injection),是一系列相關的計算機安全漏洞,通過讓經過訓練的機器學習模型(如大型語言模型)遵循人類給出的指令來遵循惡意用戶提供的指令,這與指令遵循系統的預期操作形成對比,其中機器學習模型只遵循機器學習模型操作員所提供的可信指令(提示)。[18][19][20]
提示性注入可以被看作是一種使用對抗性提示工程的代碼注入攻擊。2022年,NCC集團將提示注入定性為AI/ML系統的一類新漏洞。[21]
在2023年左右,提示注入在針對ChatGPT和類似的聊天機械人的次要漏洞中出現,例如揭示系統隱藏的初始提示,[22]或者欺騙聊天機械人參與到違反聊天機械人內容政策的對話。 [23]
參見
外部連結
參考文獻
Wikiwand in your browser!
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.