竹塹 | 哈爸筆記

當我們開始嘗試將 AI 與歷史地理資訊系統 (HGIS) 結合時，最初是在探勘總體性的《臺灣通史》。但歷史的魔鬼往往藏在地方的細節裡。為了驗證我們的架構是否具備「橫向擴展」到區域史料的能力，我將目光轉向了北台灣早期的政經中心——竹塹 (新竹)。這次，我決定一次挑戰五本重量級的地方方志：《新竹縣採訪冊》、《淡水廳志》、《樹杞林志》、《新竹縣志初稿》、《新竹縣制度考》。這五本書，總計 34 卷、9,000 多條史料片段。如果單靠純文本搜尋，那就像是在汪洋中撈針。今天，我正式在 Taiwan History Atlas 專案中，釋出了這套針對新竹史料開發的「多書跨卷整合與空間對合框架」，並同步上線了竹塹五書歷史知識地圖。 🏗️ L0-L1-L2：史料的階梯式煉金術要讓 AI 不會在這 9,000 多條文獻中「幻覺」，我們採用了嚴謹的「分散式溯源，集中式建模」三層架構： 1. L0 文獻底座 (Text ETL) 有別於單一文本，地方方志的卷次編排極度不一致。透過 hsinchu_multi_loader.py，我們實作了多種 Regex 解析器，一次性將五本史書的目錄、卷次、條目全部打散又重組，完美塞入 hsinchu_history.db 的標準 Documents -> Volumes -> Contents 結構中。 2. L1 實體萃取與降維對合 (Entities & Linkage) 光有文字不夠，我們需要提取「有意義」的節點。透過 AI 輔助腳本，我們一口氣從五書中抓出了三類實體： Infrastructure (基礎建設)：1,410 筆（橋樑、隘口、古道、城門等）。 Location (聚落空間)：4,343 筆（堡、里、庄、社、窠、坑等）。 Irrigation (水利開發)：834 筆（陂圳、埤塘、水門等）。但困難來了：古地名在地圖上是找不到座標的！例如史書寫「隆恩圳」或「林先坤陂」，現代 Google Map 根本不知道在哪。這時我們啟動了「地理特徵降維打擊」的演算法。我們寫了清洗函數（如 clean_infra_name, clean_water_name），把地名的尾巴（像是 xxx庄、xxx圳、xxx城門）全部剁掉，只保留核心字根。 ...

在建立完這套由「時光羅盤 + 歷史文本 + 自動空間配對」組成的歷史空間感知引擎 (HGIS) 後，一定有人會問：費這麼大功夫寫程式，究竟能帶來什麼改變？答案是：它將徹底顛覆我們閱讀歷史與感知旅行的方式。讓我們用新竹開源始祖——王世傑來做個火力展示。傳統閱讀法的侷限如果你翻開《臺灣通史．列傳三》，你會讀到王世傑是因為幫鄭克塽的軍隊「運餉有功」，所以獲准前去開拓「竹塹埔」。這是一個很典型的拓王傳記，但也僅止於此。 HGIS 的跨域聯動 (Knowledge Graph) 但現在，我們擁有的是一個具備空間關聯性的資料庫。我透過 SQL 引擎對全庫下達指令，去搜尋「王世傑」這三個字在整本地圖與史書中的關節點。奇蹟發生了，資料庫以空間座標為支點，將原本散落在不同章節的片段，拼湊成了一張無比立體的「城鎮規劃藍圖」：取得合法性與資本：來源：《列傳三》內容：靠著支援軍事後勤（運糧）獲得竹塹的獨家開墾特許權。這是一切政治資本的起點。切開經濟命脈 (紅藍圖釘連線)：來源：《農業志》內容：當上大開發商（業戶）後，出資主導開鑿了我們前幾天才在地圖上完成配對的**「隆恩圳（四百甲圳）」**。這條水路一口氣灌溉了兩千甲良田，也是我們最初在地形圖上看到「黃金洞」的原因！穩定社會的定海神針 (紅色圖釘)：來源：《宗教志》內容：人在吃飽之後，需要心靈依託。王世傑在南門的「巡司埔」捐地，興建了新竹最古老的觀音亭——「竹蓮寺」。透過這樣跨越篇章的串聯，王世傑的形象立體化了。他不是一個帶著鋤頭亂挖的農夫，他是用**「水利工程（養活肉體）」與「信仰中心（凝聚精神）」，聯手畫下了大新竹百年格局的城鎮綜合規劃師**。下一步：會說古書的語音助理現在，這些關聯的經緯度與史料脈絡，都已經封裝成 KML 與 JSON 格式。未來，當我們開車經過新竹市區的「竹蓮寺」，或是馳騁在「隆恩圳」遺址旁時。我的 Smart Traveling Assistant (智慧行車助理) 的雷達一旦感測到這些 WGS84 座標，就會瞬間在背景調用這套 HGIS 引擎。它會用語音告訴我：「哈爸，你現在位在竹蓮寺。這不只是一間大廟，它跟我們剛剛經過的那條隆恩圳，都是三百年前那個為了軍隊運糧的男人——王世傑，一手擘劃百年帝國的拼圖…」從地圖上的一個疑惑，到實體化一整套能運作的歷史感知大腦。這就是我們這場數位鏈金術的最終意義：讓歷史不再只存在紙上，而是真正走進了我們每一次漫遊的風景裡。 (全系列完) 本文為哈爸與 AI 助理協作產出，紀錄實體探勘與數位工程之歷程。

竹塹

歷史的降維打擊：將「竹塹五書」煉成 HGIS 空間知識庫

從地名到建構 HGIS 的數位鏈金術 (5)：【應用】從拓荒者到城鎮規劃師——用 HGIS 立體化「王世傑」的歷史足跡