【台灣數據閃耀全球】許雁嘉博士領銜阿姆斯特丹大學團隊，開發 Veli AI 模型：以台灣「空氣盒子」實戰經驗，解鎖全球精準監測新紀元！20260328

【前言】呼吸權的數位革命：從台灣巷弄走向全球視野
在氣候變遷與都市化急遽擴張的今日，空氣品質監測已不再只是氣象局的枯燥數字，而是攸關每個人生命健康的關鍵情報。長期以來，精準的監測數據始終被壟斷在造價昂貴、分布稀疏的政府觀測站手中。儘管近年來「低成本感測器」如雨後春筍般出現在城市角落，卻因硬體限制導致誤差不斷，難以成為科學決策的依據。

由荷蘭阿姆斯特丹大學助理教授、台籍學者許雁嘉（Yen-Chia Hsu）博士所率領的研究團隊，正試圖打破這道技術高牆。他們開發的 Veli 模型，不僅是一項 AI 技術的里程碑，更是一場關於「環境正義」的數位革命。這項研究最令台灣人振奮之處，在於它深度吸納了台灣「空氣盒子」計畫多年積累的龐大大數據，將台灣巷弄間的感測經驗，轉化為全球通用的科學標準。本報導將深入解析這項榮登國際頂尖 AI 殿堂 AAAI 的研究成果，見證台灣如何從受監測者變身為全球環境技術的關鍵輸出者。

===

第一章：隱形的呼吸危機：當廉價感測器遇上數據信任的「最後一哩路」
1.1 萬物吞吐間的隱患：全球空氣監測的空間盲區
我們每一次的呼吸，本應是生命最自然的律動，但在工業化與都市化高度擴張的今天，這份律動正籠罩在無形威脅之下。根據 WHO 的驚人數據，全球有超過九成人口呼吸著超標空氣，其中的 PM2.5 微粒能輕易穿透肺泡進入血液循環，引發從氣喘到心血管疾病的連鎖反應。然而，捕捉這些「隱形殺手」的代價極其昂貴，官方監測站單座造價動輒數百萬台幣，導致點位分布極為稀疏。這種「以點代面」的局限性，使得我們難以掌握特定巷弄、工業區邊緣或校園操場的真實品質，在城市中留下了巨大的監測盲區。

1.2 草根力量的崛起：低成本感測器的普及與「信任瓶頸」
為了填補官方監測的空白，過去十年全球掀起了一場「低成本感測器（LCS）」革命。其中最典型的代表，便是由台灣公民社群、學界與政府合作推動的「空氣盒子（AirBox）」。這項計畫讓監測權不再是政府的專利，由下而上的「公民科學」運動，理論上能勾勒出極為細緻、動態的城市污染地圖。然而，這股草根力量卻撞上了一道巨大的牆：數據公信力。當廉價感測器的數值與官方數據不一致時，民眾往往陷入徬徨，無法判斷這是真實的污染事件還是設備故障。這種信任危機，使得充滿活力的草根數據難以進入核心決策圈。

1.3 致命的技術缺陷：環境雜訊、漂移與電子元件的先天限制
為什麼廉價感測器難獲專業科學家的信任？這源於其物理特性的先天不足。這些設備極易受到非污染因素的干擾：首先是「環境干擾」，在氣候潮濕的地區，水蒸氣經常被光學感測器誤判為粉塵；其次是「硬體漂移（Drift）」，電子元件會隨時間老化導致讀數逐漸偏離真實值。此外，還有電力波動產生的偽尖峰（Spikes）以及通訊異常。在嚴謹的數據分析師眼中，未經校正的原始數據充滿噪訊，若直接套用，不僅會引發社會恐慌，更可能導致錯誤的政策推論。這讓低成本感測器陷入「雖普及但粗糙」的尷尬境地。

1.4 傳統校準的枷鎖：難以跨越的「參考站對答案」門檻
目前的標準作法是「共置校準（Co-location）」，即把廉價感測器放在官方精密測站旁「對答案」數週。這種方法雖然有效，卻存在致命缺陷：它極度依賴昂貴且位置固定的參考站。如果你想在一個沒有官方測站的偏遠山區、災難現場或資源匱乏的發展中國家部署感測網絡，你根本沒有「標準答案」可以對照。更糟的是，感測器一旦移開校準點，其精準度往往因環境變遷而劇降。這種對「物理基準」的依賴，成為限制環境監測民主化的最後一道枷鎖。許雁嘉博士團隊的目標，正是要透過 AI 讓感測器在沒有參考站的情況下也能「自我覺醒」，說出真相。

===

第二章：Veli 的革命性突破：無需參考基準的 AI 自我修復奇蹟
2.1 數位偵探的誕生：變分推理（Variational Inference）的機率美學
面對 LCS 產出的大量「髒數據」，許雁嘉博士與團隊深知，傳統的線性修正已無法應對現實的複雜。他們提出的 Veli 模型，其核心靈魂源自於 AI 領域極具深度的「變分推理」。這套模型不只是被動地接收數字，它更像是一位具備強大直覺的數位偵探。想像感測器捕捉到的 PM2.5 數值，是被層層迷霧遮蔽的風景，肉眼只能看到扭曲的色塊。Veli 透過變分推理的機率框架，不急於斷定一個死板的數字，而是推導出產生這些數字背後的原始物理狀態，在不確定的訊號中挖掘出最接近真實環境的機率分佈。

2.2 解耦表示技術：在潛在空間中將「真實」與「虛假」徹底剝離
Veli 最令國際學界驚艷的技術亮點，在於其卓越的「解耦表示（Disentangled Representation）」能力。在過去，當環境濕度驟升，導致廉價感測器的讀數因光學反射而劇烈飆漲時，傳統演算法極難判斷這是「污染加重」還是「水氣干擾」。但 Veli 模型在數學的「潛在空間」中建構了多個維度，成功實現了訊號的精準分離：一個維度專門捕捉反映真實狀態的「污染物濃度」，另一個維度則專門歸納感測器特有的「雜訊、老化與環境干擾」。這就像是在一段充斥雜音的磁帶中，Veli 能將歌手清澈的嗓音與背景沙沙聲完美分離。

2.3 無監督學習的自由：打破「共置校準」的物理依賴
在 Veli 問世之前，幾乎所有的校準模型都屬於「監督式學習」，這意味著 AI 必須先「看過」官方精密站點的標準答案，才能學會如何修正錯誤。然而，Veli 採用的「無監督學習」模式，讓它不再需要昂貴且不可得的參考數據來「對答案」。它透過觀察整個感測器網絡在時空變換中的關聯性，自動識別出哪些變動是區域共有的真實污染規律，哪些是個別設備突發的技術錯誤。這種「無參考校準（Reference-free）」的特性，賦予了監測網前所未有的自由度，使其能夠在世界任何角落即刻發揮守護功能。

2.4 對抗失效的韌性：即便數據殘缺，依然展現數位戰鬥力
在真實部署環境中，感測器經常面臨斷網、斷電或因極端氣候導致的硬體失效，產生尖峰（Spikes）。論文數據顯示，傳統濾波修正法在面對劇烈波動時往往會崩潰。然而，Veli 展現了驚人的「數位韌性（Digital Resilience）」——即便在感測器數據發生大規模丟失，或者在原本就極為稀疏的低密度網絡中（例如一區僅有 3 個感測器），Veli 依然能維持穩定的修正性能。這項特性對於資源匱乏地區尤為珍貴，它確保了環境監測不再是脆弱的貴族實驗，而是一套具有強大生存能力的系統。

===

第三章：台灣「空氣盒子」的關鍵角色：全球最嚴苛考場的震撼教育
3.1 跨越半個地球的連結：許雁嘉博士與台灣公民科學的共鳴
這項由阿姆斯特丹大學主導的研究，其靈魂正是台籍學者許雁嘉博士。許博士始終堅信技術若脫離在地參與，僅能淪為實驗室裡的精準數據。因此，他將台灣引以為傲、參與度全球第一的「空氣盒子（AirBox）」監測網絡引入了研究核心。台灣的空氣盒子計畫不僅是萬計感測器的布建，更是一場由中研院、教育部與 LASS 開源社群共同編織的社會實踐。許博士成功將源自台灣巷弄的「草根數據」，無縫對接到歐洲尖端的 AI 運算架構中。

3.2 難度最高的「魔王級考卷」：台灣極端環境的壓力測試
在 Veli 模型的訓練過程中，研究團隊需要一個具備高度變數的環境。如果說阿姆斯特丹的數據是規律的「基礎教材」，那麼台灣的數據就是一張「魔王級考卷」。台灣地形崎嶇、人口與機車密度極高，且氣候長期處於高溫高濕。對於感測器的光學元件而言，水蒸氣經常導致讀數出現「假陽性」。此外，台灣密集的移動污染源，使得空氣品質的波動呈現強烈的非線性特徵。Veli 模型必須在這種極度吵雜的訊號中提取真實濃度。研究證明，一套 AI 若能在台灣「活下來」，就具備了征服全球的能力。

3.3 跨國泛化驗證：證明「台灣經驗」具備改變世界的普世價值
這項論文中最令學界振奮的實驗，在於證實了模型的「泛化能力」。團隊先利用荷蘭較為規律的數據訓練 Veli，隨後將這顆「歐洲大腦」直接空降到台灣感測網進行實測。實驗發現，僅需透過少量的台灣在地數據進行「微調（Fine-tuning）」，Veli 就能迅速理解台灣獨特的污染模式，產出極其精準的結果。這證明了台灣數據不僅能解決台灣的問題，更能作為一套「全球基準」，幫助其他氣候相似、監測資源匱乏的亞洲或熱帶國家快速建立起可靠系統。

3.4 數據主權與科技外交：台灣從「受測者」躍升為「技術貢獻者」
透過這項研究，台灣在國際環境科研地圖上的角色發生了質變。在許雁嘉博士的媒合下，台灣大數據正式轉化為國際科研的「輸出引擎」。這不僅是一次成功的學術跨國合作，更是一場優雅的「科技外交」。論文中採用的台灣站點數據規模龐大且具多樣性，讓全球科學家見證了台灣在 IoT 領域的領先地位。當 Veli 模型展示卓越性能時，其背後的真實戰力，正是來自於那幾千個部署在台灣小學操場、默默守護呼吸的空氣盒子。

===

第四章：AQ-SDR 數據庫：打破知識壟斷，點燃全球科研的火種
4.1 數據孤島的終結：建立全球最大規模的環境監測基準
在空氣科學領域，長期存在著數據破碎化與封閉性的瓶頸。科研人員若想開發通用的 AI 模型，往往需耗費數年去清洗不同格式的資料。許雁嘉博士團隊發表了 AQ-SDR（空氣品質感測器數據庫）。這是目前全球規模最大的基準，涵蓋了超過 23,737 個測站，跨越六年。這不只是數字，它更是一座人類與環境對抗的數位歷史檔案館，為全球提供了一個統一且強大的科學基礎建設。

4.2 跨國界的數據地圖：從阿姆斯特丹到台北的深度整合
AQ-SDR 整合了荷蘭的精細監測、美國 EPA 的官方數據、台灣密集的空氣盒子網絡，以及義大利等地的多元樣本。這套資料庫將不同廠牌、氣候背景下的感測數據轉化為統一格式。這意謂著身處資源匱乏地區的研究員，不再需要親自布建數萬感測器，就能利用 AQ-SDR 提供的全球樣本，在實驗室中訓練出能適應當地的 AI 模型。

4.3 錯誤的價值：詳盡標註感測器「失常模式」的深度洞察
AQ-SDR 詳盡記錄了感測器的各種「錯誤」。精確記錄了感測器老化的「數據漂移」、因電力不穩產生的「異常尖峰」，以及「數據缺失」。對於開發 Veli 的團隊來說，這些「錯誤樣本」是訓練 AI 識別並剔除雜訊的最佳教材。透過公開這些失效模式，研究團隊幫助全球開發者省去了大量摸索的時間，讓大家能針對性地開發出更強大的修復演算法。

4.4 數據民主化：賦能資源匱乏地區，實踐環境正義
AQ-SDR 的出現實現了「數據民主化」的願景。它讓資源匱乏地區的科學家能直接站在頂尖研究的肩膀上，學習如何在當地多變氣候下，利用廉價設備產出具備信賴度的報告。許博士深信，唯有當數據不再被壟斷，全世界公民科學家都能參與環境治理時，才能真正實現全球性的環境公平。

===

第五章：守護每一口呼吸：賦能社群與落實環境正義的終極願景
5.1 社會技術系統的實踐：讓科技擁有守護生命的溫度
許雁嘉博士始終堅持「社會技術系統（Socio-technical Systems）」的設計理念。對他而言，空氣監測不職是感測器與演算法的組合，更是一個涉及人類行為與社區組織的生命體。Veli 的成功解決了「信任」的社會難題。當 AI 能夠在缺乏官方測站的情況下提供具公信力的數據，它實際上是在賦予普通民眾一種強大的科技武裝。這種賦能（Empowerment）讓社區居民不再只是數據的被動接收者，而是能掌握證據的主動治理者。

5.2 環境正義的數據盾牌：為弱勢社區奪回環境話語權
環境不正義往往源於資訊與資源的不對等。過去工業區周邊或弱勢社區，常因缺乏昂貴官方站而難以證明污染威脅；居民數據也常被以「不精準」為由駁回。現在，有了 Veli 這種校正技術，廉價感測器的讀數擁有了與官方對等對話的底氣。這項成果為全球弱勢社區打造了一面堅實的「數據盾牌」，讓他們能用科學證據捍衛自己的呼吸權利。

5.3 邁向數位孿生城市：高解析度監測的治理新紀元
展望未來，Veli 模型與 AQ-SDR 的結合將成為建構「數位孿生（Digital Twin）」城市的基石。想像一個未來城市，成千上萬校準後的感測器構成如同神經網絡般的監測系統。管理者可以即時、細緻地看見每一條街道的品質動態，精確評估政策對健康的具體影響。台灣在「空氣盒子」計畫累積的豐碩經驗，結合許博士團隊開發的尖端 AI，正預示著一個精準治理新時代。

5.4 結語：讓清新空氣成為每個人的基本人權
這項深度融合台灣數據精華的研究傳達了一個訊息：透過創新科技與公民參與，我們可以奪回呼吸的自主權。許雁嘉博士的旅程從台灣公民社群出發，在歐洲頂尖學術殿堂開花結果，再回饋給全球公民。這不只是 AAAI 的優秀論文，更是科技向善（Tech for Good）的行動宣言。它提醒我們，科技發展的終極歸宿是守護生命、消弭不平等，確保地球上的每一個生命都能擁有一口清新的空氣。

===

核心地圖：Veli 論文技術架構與邏輯全覽
1.核心挑戰 (The Problem)
o感測器缺陷：受高濕度干擾（環境雜訊）與硬體老化（數據漂移）。
o部署枷鎖：傳統校準極度依賴固定位置的「官方參考站」。
2.核心技術 (The Solution)
o變分推理：推導數據背後的物理機率分布。
o解耦表示：在數學空間中將「真實讀數」與「硬體雜訊」徹底分離。
o無監督學習：無需參考站（Reference-free），實現自我校正。
3.數據基石 (The Infrastructure)
oAQ-SDR：全球最大基準庫（23,737 測站 / 6 年數據）。
o台灣靈魂：深度整合台灣空氣盒子（AirBox）的開源巨量數據。
4.實證結論 (The Outcome)
o泛化奇蹟：證明在歐洲訓練的模型，透過台灣環境測試並微調，具備全球通用性。

===

撰稿參考文獻 (Reference List)
1.Dalbah, Y., Worring, M., & Hsu, Y. C. (2026). Veli: Unsupervised Method and Unified Benchmark for Low-Cost Air Quality Sensor Correction. In Proceedings of the 40th AAAI Conference on Artificial Intelligence (AAAI-26).
2.Chen, L. J., et al. (LASS Community). (2017). AirBox: A Participatory Sensor Network for Real-Time Fine-Grained Air Quality Monitoring. IEEE International Conference on Distributed Computing Systems.
3.Hsu, Y. C., et al. (2019). Smell Pittsburgh: Engaging Community to Document and Visualize Environmental Data. ACM Transactions on Interactive Intelligent Systems.

分享此文：

相關