生成式人工智能通過關注基于意圖的結果規范,為人類與系統交互提供了一種新的方式。GenAI 帶來了新的挑戰,因為它的輸出是概率性的,需要理解變異性、記憶、錯誤、幻覺和惡意使用,這就帶來了構建原則和設計模式的必要性,正如 IBM 所描述的那樣。
此外,任何AI 產品都是一個分層系統,其中 LLM 只是其中一種成分,而內存、編排、工具擴展、UX 和代理用戶流才是真正的魔力!
本文是我對 GenAI 設計模式演變的研究和記錄,這些模式為產品經理、數據科學家和交互設計師提供了一種通用語言 ,幫助他們打造以人為本、值得信賴且安全的產品。通過應用這些模式,我們可以彌合用戶需求、技術能力和產品開發流程之間的差距。
評估 GenAI 是否改善了用戶體驗或增加了復雜性。通常,基于啟發式 (IF/Else) 的解決方案更易于構建和維護。
這種模式確保 GenAI 開發始于用戶意圖以及實現該意圖所需的數據模型。GenAI
系統的優劣取決于其訓練數據。但真正的用戶并非以行列的方式表達,他們表達的是目標、挫折和行為。如果團隊未能將用戶需求轉化為結構化的、模型可用的輸入,最終的系統或產品可能會優化到錯誤的結果,從而導致用戶流失。
GenAI 應用中的一個關鍵決策是完全自動化任務還是增強人類能力。使用此模式可以使技術與用戶意圖和控制偏好保持一致。
自動化最適合用戶傾向于委派的任務,尤其是在繁瑣、耗時或不安全的情況下。例如,Intercom FinAI 會自動將冗長的電子郵件線索匯總為內部筆記,從而節省重復性、低價值任務的時間。
增強功能能夠提升效率、創造力和控制力,從而增強用戶想要持續參與的任務。例如, Abelton 的Magenta Studio支持創造性的控制,方便用戶操控和創作新音樂。
在人工智能系統中,自動化指的是將多少控制權委托給人工智能而不是用戶。這是一種戰略性的用戶體驗模式,它根據用戶的痛點、情境場景和對產品的期望來決定自動化程度。
當用戶第一次接觸基于新技術的產品時,他們常常想知道系統能做什么和不能做什么,它如何工作以及他們應該如何與它交互。
該模式提供了多維策略來幫助用戶使用 AI 產品或功能、減少錯誤、與用戶準備情況保持一致,以提供明智且以人為本的用戶體驗。
這種模式是許多其他模式的頂峰
心智模型幫助用戶預測系統(網頁、應用程序或其他類型的產品)的運作方式,從而影響他們與界面的交互方式。當產品與用戶現有的心智模型相符時,用戶會感覺直觀且易于上手。當兩者發生沖突時,可能會導致用戶沮喪、困惑,甚至放棄。
例如,Github Copilot 建立在開發人員從傳統代碼自動完成的思維模型之上,從而簡化了向 AI 驅動的代碼建議的過渡
例如,Adobe Photoshop 建立在使用矩形控件擴展圖像的熟悉方法的基礎上,通過集成其生成填充功能,智能地填充新創建的空間。
通過提問來識別并建立現有的心智模型
這種模式涉及清楚地傳達人工智能模型能做什么和不能做什么,包括其知識邊界、能力和局限性。
它有助于建立用戶信任、設定適當的期望、防止誤用,并在模型出現故障或異常行為時減少挫敗感。
在人工智能系統中,思路鏈(CoT) 提示 技術 通過模仿人類更結構化、循序漸進的思維過程,增強了模型解決復雜問題的能力。
CoT 展示是一種用戶體驗模式,它通過揭示 AI 是如何得出結論的來提高透明度。這可以增強用戶信任,提高可解釋性,并為用戶反饋提供空間,尤其是在高風險或模糊場景下。
例如,Perplexity通過顯示處理步驟來增強透明度,幫助用戶理解答案背后的深思熟慮的過程。
例如,Khanmigo是一種人工智能輔導系統,它通過模仿人類推理來逐步指導學生解決問題,以增強理解和學習。
GenAI 憑借其概率特性,能夠對同一輸入產生不同的響應。這種模式通過并排呈現多個輸出來利用可變性。展示多樣化的選項有助于用戶創造性地探索、比較、改進或做出更符合其意圖的決策。例如, Google Gemini提供了多種選項,幫助用戶探索、改進并做出更明智的決策。
在 GenAI 應用程序中,清晰地闡明數據源對于透明度、可信度和用戶信任至關重要。清晰地表明 AI 的知識來源有助于用戶評估響應的可靠性并避免錯誤信息。
這在醫療保健、金融或法律指導等高風險事實領域尤其重要,因為決策必須基于經過驗證的數據。
AI 生成的輸出具有概率性,準確度可能存在差異。顯示置信度分數可以傳達模型對其輸出的確定性。這有助于用戶評估可靠性并做出更明智的決策。
記憶和回憶是一個重要的概念和設計模式,它使人工智能產品能夠存儲和重用過去交互中的信息,例如用戶偏好、反饋、目標或任務歷史,以提高連續性和情境感知。
用于訪問信息的記憶可能是短暫的(會話內的短期)或持久的(跨會話的長期),并且可能包括對話上下文、行為信號或明確的輸入。
情境輸入參數通過簡化用戶交互來提升用戶體驗,并更快地實現用戶目標。通過利用用戶特定數據、用戶偏好、過往交互,甚至來自其他具有相似偏好的用戶的數據,GenAI 系統可以定制輸入和功能,以更好地滿足用戶意圖和決策。
副駕駛是一種增強模式,AI 充當協作助手,在用戶掌控全局的同時,提供情境化和數據驅動的洞察。這種設計模式在戰略制定、構思、寫作、設計或編碼等領域至關重要,因為這些領域的結果具有主觀性,用戶擁有獨特的偏好,或者用戶的創意輸入至關重要。
副駕駛 加快工作流程,增強創造力并減少認知負荷,但人類仍保留創作權和最終決策權。
構建 UI 級機制,讓用戶根據用戶目標、上下文場景或系統故障狀態管理或覆蓋自動化。
沒有系統能夠預測所有用戶情境??刂瀑x予用戶自主權,即使人工智能出錯,也能保持信任。
GenAI 系統通常依賴于對人類輸入的解讀。當用戶提供模糊、不完整或錯誤的信息時,AI 可能會誤解其意圖或產生低質量的輸出。
輸入錯誤通常反映的是用戶期望與系統理解之間的不匹配。妥善處理這些問題對于維護信任和確保順暢的交互至關重要。
GenAI 輸出本質上是概率性的,容易出現幻覺、偏見和上下文錯位等錯誤。
與傳統系統不同,GenAI 的錯誤狀態難以預測。針對這些狀態進行設計需要透明度、恢復機制和用戶自主性。精心設計的錯誤狀態可以幫助用戶了解 AI 系統的邊界并重新獲得控制權。
混淆矩陣有助于分析人工智能系統錯誤,并通過顯示以下計數來深入了解模型的執行情況
-真陽性(正確識別陽性案例)
-假陽性(錯誤識別陽性案例)
-真陰性(正確識別陰性案例)
-假陰性(未能識別陰性案例)
現實世界的一致性需要直接的用戶反饋來改進模型,從而改進產品。當人們與人工智能系統互動時,他們的行為會塑造并影響他們未來收到的輸出。從而形成一個持續的反饋循環,系統和用戶的行為都會隨著時間的推移而不斷調整。例如,ChatGPT使用“反應”按鈕和“評論”框來收集用戶反饋。
強大的 GenAI 模型需要在訓練期間以及部署后持續進行評估。評估旨在確保模型按預期運行,識別錯誤和幻覺,并與用戶目標保持一致,尤其是在高風險領域。
有三種關鍵的評估方法可以改進機器學習系統。
人工智能護欄的設計意味著在GenAI模型中建立實踐和原則,以最大限度地減少傷害、錯誤信息、不良行為和偏見。至關重要的是
這種模式確保 GenAI 應用程序清楚地傳達如何收集、存儲、處理和保護用戶數據。
GenAI 系統通常依賴于敏感數據、情境數據或行為數據。處理不當可能會導致用戶不信任、法律風險或意外濫用。清晰地傳達隱私保護措施有助于用戶感到安全、受到尊重并掌控全局。例如,Slack AI 明確表示,客戶數據仍歸客戶所有并控制,不會用于訓練 Slack 或任何第三方 AI 模型。
蘭亭妙微(www.gerard.com.cn )是一家專注而深入的界面設計公司,為期望卓越的國內外企業提供卓越的大數據可視化界面設計、B端界面設計、桌面端界面設計、APP界面設計、圖標定制、用戶體驗設計、交互設計、UI咨詢、高端網站設計、平面設計,以及相關的軟件開發服務,咨詢電話:01063334945。我們建立了一個微信群,每天分享國內外優秀的設計,有興趣請加入一起學習成長,咨詢及進群請加藍小助微信ben_lanlan。