「2+1 快手」開發實錄:打破 AI 與現實世界的「摩擦力」
在開發 AI 應用的過程中,起初我並非直接針對「與 AI 對話」的體驗進行設計,而是希望能有一套自動化工具的支援,來 Offload (卸載) LLM 的使用負擔。但在開發過程中,意外地發展出一套極其高效的自動化開發與探勘環境,這就是 「2+1 快手」 的由來。 這不只是一套腳本,而是一種重新定義「自動化卸載」的設計哲學。 1. 原來的問題:如何讓 LLM 專注於高價值工作? 在與 LLM 深度協作時,我發現如果所有事情都丟給模型處理,不僅成本高昂,且許多重複性的環境感知、資料檢索與動作執行工作,LLM 的表現並不穩定。 我需要一種「感官化」的自動化中樞,它能幫 LLM 處理掉繁瑣的物理邊界問題(例如:座標在哪、現在是什麼環境),讓模型專注於最後的語義合成與意圖判斷。 2. 架構說明:三位一體的演化架構 「2+1」的核心在於兩個強大的底層工具(Hammerspoon 與 Fabfile),以及一個最方便的 人機界面 (Just): A. 第 1 核:感官與執行 (Sensory & Actuator) - Hammerspoon 這是系統的「神經末梢」與「執行器」。 物理觀察:Hammerspoon (HS) 負責持續監控物理世界的數據,如座標系統 (GPS)、航向、速度。 本能反應:當「大腦」下達指令,HS 負責執行最終的物理行動(如呼叫系統語音播報或切換 UI)。 B. 第 2 核:邏輯中樞 (Intelligence) - Fabfile 這是系統的「重型中樞」,承載著最耗資源的運算與邏輯。 AI 智力與資料對齊:調度 Gemini 執行深度邏輯判定,並與現有的本地資料庫進行檢索對齊。 它負責將感官層傳來的原始數據,轉生為具備價值的決策或內容。 C. 那個關鍵的「+1」:數位本能 (Interface) - Just 這是我目前覺得 最方便 的核心。 本能化封裝:Just 在這裡扮演了關鍵的 +1 角色。它將複雜的 HS 與 Fab 運作,封裝成人類可以直覺呼叫的「短指令」。 能力的最終成果:Just 不只是通訊協議,它代表的是「能力的最終產出」。使用者不需要理解底層如何連動,只需記住一個簡單的縮寫即可發動複雜的異質系統連動。 3. 運行優勢實證:三劍客的聯動威力 透過「2+1」架構,幾個關鍵的自動化場景得以實現: ...