歷史的降維打擊:將「竹塹五書」煉成 HGIS 空間知識庫

當我們開始嘗試將 AI 與歷史地理資訊系統 (HGIS) 結合時,最初是在探勘總體性的《臺灣通史》。但歷史的魔鬼往往藏在地方的細節裡。 為了驗證我們的架構是否具備「橫向擴展」到區域史料的能力,我將目光轉向了北台灣早期的政經中心——竹塹 (新竹)。這次,我決定一次挑戰五本重量級的地方方志:《新竹縣採訪冊》、《淡水廳志》、《樹杞林志》、《新竹縣志初稿》、《新竹縣制度考》。 這五本書,總計 34 卷、9,000 多條史料片段。如果單靠純文本搜尋,那就像是在汪洋中撈針。 今天,我正式在 Taiwan History Atlas 專案中,釋出了這套針對新竹史料開發的「多書跨卷整合與空間對合框架」,並同步上線了 竹塹五書歷史知識地圖。 🏗️ L0-L1-L2:史料的階梯式煉金術 要讓 AI 不會在這 9,000 多條文獻中「幻覺」,我們採用了嚴謹的「分散式溯源,集中式建模」三層架構: 1. L0 文獻底座 (Text ETL) 有別於單一文本,地方方志的卷次編排極度不一致。透過 hsinchu_multi_loader.py,我們實作了多種 Regex 解析器,一次性將五本史書的目錄、卷次、條目全部打散又重組,完美塞入 hsinchu_history.db 的標準 Documents -> Volumes -> Contents 結構中。 2. L1 實體萃取與降維對合 (Entities & Linkage) 光有文字不夠,我們需要提取「有意義」的節點。 透過 AI 輔助腳本,我們一口氣從五書中抓出了三類實體: Infrastructure (基礎建設):1,410 筆(橋樑、隘口、古道、城門等)。 Location (聚落空間):4,343 筆(堡、里、庄、社、窠、坑等)。 Irrigation (水利開發):834 筆(陂圳、埤塘、水門等)。 但困難來了:古地名在地圖上是找不到座標的! 例如史書寫「隆恩圳」或「林先坤陂」,現代 Google Map 根本不知道在哪。 這時我們啟動了 「地理特徵降維打擊」 的演算法。我們寫了清洗函數(如 clean_infra_name, clean_water_name),把地名的尾巴(像是 xxx庄、xxx圳、xxx城門)全部剁掉,只保留核心字根。 ...

2026-02-23 · 1 min · 159 words · Wuulong

從地名到建構 HGIS 的數位鏈金術 (5):【應用】從拓荒者到城鎮規劃師——用 HGIS 立體化「王世傑」的歷史足跡

在建立完這套由「時光羅盤 + 歷史文本 + 自動空間配對」組成的 歷史空間感知引擎 (HGIS) 後,一定有人會問:費這麼大功夫寫程式,究竟能帶來什麼改變? 答案是:它將徹底顛覆我們閱讀歷史與感知旅行的方式。 讓我們用新竹開源始祖——王世傑 來做個火力展示。 傳統閱讀法的侷限 如果你翻開《臺灣通史.列傳三》,你會讀到王世傑是因為幫鄭克塽的軍隊「運餉有功」,所以獲准前去開拓「竹塹埔」。這是一個很典型的拓王傳記,但也僅止於此。 HGIS 的跨域聯動 (Knowledge Graph) 但現在,我們擁有的是一個具備空間關聯性的資料庫。我透過 SQL 引擎對全庫下達指令,去搜尋「王世傑」這三個字在整本地圖與史書中的關節點。 奇蹟發生了,資料庫以空間座標為支點,將原本散落在不同章節的片段,拼湊成了一張無比立體的「城鎮規劃藍圖」: 取得合法性與資本: 來源:《列傳三》 內容:靠著支援軍事後勤(運糧)獲得竹塹的獨家開墾特許權。這是一切政治資本的起點。 切開經濟命脈 (紅藍圖釘連線): 來源:《農業志》 內容:當上大開發商(業戶)後,出資主導開鑿了我們前幾天才在地圖上完成配對的**「隆恩圳(四百甲圳)」**。這條水路一口氣灌溉了兩千甲良田,也是我們最初在地形圖上看到「黃金洞」的原因! 穩定社會的定海神針 (紅色圖釘): 來源:《宗教志》 內容:人在吃飽之後,需要心靈依託。王世傑在南門的「巡司埔」捐地,興建了新竹最古老的觀音亭——「竹蓮寺」。 透過這樣跨越篇章的串聯,王世傑的形象立體化了。他不是一個帶著鋤頭亂挖的農夫,他是用**「水利工程(養活肉體)」與「信仰中心(凝聚精神)」,聯手畫下了大新竹百年格局的城鎮綜合規劃師**。 下一步:會說古書的語音助理 現在,這些關聯的經緯度與史料脈絡,都已經封裝成 KML 與 JSON 格式。 未來,當我們開車經過新竹市區的「竹蓮寺」,或是馳騁在「隆恩圳」遺址旁時。我的 Smart Traveling Assistant (智慧行車助理) 的雷達一旦感測到這些 WGS84 座標,就會瞬間在背景調用這套 HGIS 引擎。 它會用語音告訴我: 「哈爸,你現在位在竹蓮寺。這不只是一間大廟,它跟我們剛剛經過的那條隆恩圳,都是三百年前那個為了軍隊運糧的男人——王世傑,一手擘劃百年帝國的拼圖…」 從地圖上的一個疑惑,到實體化一整套能運作的歷史感知大腦。這就是我們這場數位鏈金術的最終意義:讓歷史不再只存在紙上,而是真正走進了我們每一次漫遊的風景裡。 (全系列完) 本文為哈爸與 AI 助理協作產出,紀錄實體探勘與數位工程之歷程。

2026-02-22 · 1 min · 56 words · Wuulong