[哈爸筆記] 讓 AI 擁有地理動向的靈魂:智慧行車導遊兩日開發實錄

最近兩天,我跟我的 AI 夥伴 (Antigravity) 泡在 Travel-Advisor-HUD 這個專案裡。目標很單純:讓我的行車助理不再只是「唸出路名」,而是像個真正懂我的「私人導遊」。 在兩天的密集對話中,我們經歷了幾次關鍵的「卡關」與「破繭而出」,這幾個點我覺得是開發地理感知型 AI (Geographic AI) 最迷人的地方。 🚀 什麼是 Travel Advisor HUD? 這是一個跨裝置的行車助理系統:由 Mac 負責背景運算與大腦邏輯,iPad 則作為沈浸式視覺看板 (HUD)。它能感知你的位置、速度與航向,並結合你過去在 WalkGIS 筆記中的內容,由 Gemini 生成具備人文厚度的即時導覽。 🧩 關鍵卡關與突破 1. 沉重的 Geopandas 與「資料主權」的執念 一開始,我們想用 Python 的 Geopandas 來處理鄉鎮邊界 (SHP) 的空間對位。但在路測邏輯中,Geopandas 顯得過於笨重,且我有一個堅持:「資料主權」。 我不想為了讓 AI 讀數據,就把我珍貴的 walkgis.db (私有筆記) 或內政部的圖資檔案搬來搬去、轉檔轉去。 突破點:我們轉向了 SpatiaLite (SQLite 的空間外掛)。 心得:透過 ATTACH DATABASE 直接掛載原始 DB,並用 VirtualShape 虛擬映射 SHP 檔案。資料「原地不動」,但查詢卻是極速的 SQL 指令。這讓「資料主權」與「運算效能」在這一層完美的對位了。 2. 從「歡迎」到「盤點」的內容層次 原先的導覽很死板:進入新縣市就唸一段 Wiki 簡介。但開車的人真正需要的是:「這裡有沒有我以前記過的東西?」 卡關:AI 雖然強筆強大,但如果你不給它具體的「本地上下文」,它只會說些漂亮但空泛的廢話。 突破點:「行政區點位盤點 (Township Inventory)」機制。 心得:在跨越邊界的瞬間,系統自動在背景先發動一次空間點名,把該鄉鎮內所有關於我的私有筆記 POI 抓出來,做成摘要餵給 Gemini。當 AI 說出:「歡迎來到橫山,這裡有您之前筆記過的內灣車站喔…」時,那種「它真的懂我」的導覽感才算真正建立。 3. Hammerspoon 的定時器與動態設定 Hammerspoon 雖然穩定,但預設的定時器是靜態的。如果我在開車中想調整檢查頻率(比如從 5 分鐘改成 1 分鐘),以往我得停下車,打開 Mac、改代碼、Reload Config。 ...

2026-03-11 · 1 min · 145 words · Wuulong

「2+1 快手」開發實錄:打破 AI 與現實世界的「摩擦力」

在開發 AI 應用的過程中,起初我並非直接針對「與 AI 對話」的體驗進行設計,而是希望能有一套自動化工具的支援,來 Offload (卸載) LLM 的使用負擔。但在開發過程中,意外地發展出一套極其高效的自動化開發與探勘環境,這就是 「2+1 快手」 的由來。 這不只是一套腳本,而是一種重新定義「自動化卸載」的設計哲學。 1. 原來的問題:如何讓 LLM 專注於高價值工作? 在與 LLM 深度協作時,我發現如果所有事情都丟給模型處理,不僅成本高昂,且許多重複性的環境感知、資料檢索與動作執行工作,LLM 的表現並不穩定。 我需要一種「感官化」的自動化中樞,它能幫 LLM 處理掉繁瑣的物理邊界問題(例如:座標在哪、現在是什麼環境),讓模型專注於最後的語義合成與意圖判斷。 2. 架構說明:三位一體的演化架構 「2+1」的核心在於兩個強大的底層工具(Hammerspoon 與 Fabfile),以及一個最方便的 人機界面 (Just): A. 第 1 核:感官與執行 (Sensory & Actuator) - Hammerspoon 這是系統的「神經末梢」與「執行器」。 物理觀察:Hammerspoon (HS) 負責持續監控物理世界的數據,如座標系統 (GPS)、航向、速度。 本能反應:當「大腦」下達指令,HS 負責執行最終的物理行動(如呼叫系統語音播報或切換 UI)。 B. 第 2 核:邏輯中樞 (Intelligence) - Fabfile 這是系統的「重型中樞」,承載著最耗資源的運算與邏輯。 AI 智力與資料對齊:調度 Gemini 執行深度邏輯判定,並與現有的本地資料庫進行檢索對齊。 它負責將感官層傳來的原始數據,轉生為具備價值的決策或內容。 C. 那個關鍵的「+1」:數位本能 (Interface) - Just 這是我目前覺得 最方便 的核心。 本能化封裝:Just 在這裡扮演了關鍵的 +1 角色。它將複雜的 HS 與 Fab 運作,封裝成人類可以直覺呼叫的「短指令」。 能力的最終成果:Just 不只是通訊協議,它代表的是「能力的最終產出」。使用者不需要理解底層如何連動,只需記住一個簡單的縮寫即可發動複雜的異質系統連動。 3. 運行優勢實證:三劍客的聯動威力 透過「2+1」架構,幾個關鍵的自動化場景得以實現: ...

2026-02-20 · 1 min · 129 words · Wuulong