2016年3月14日 星期一

濾波器發散 (Filter Divergence)


    系集卡爾曼濾波器(Ensemble-based Kalman Filter, EnKF)是利用系集預報後,各系集成員間的差異來估計背景誤差結構,而EnKF的表現取決於系集能否完整的表達真實大氣的特性,這牽扯到模式的動力是否完整正確、系集的樣本數是否足夠等因素。實作上因受限於計算資源,系集樣本數不可能太大,故EnKF經常面臨樣本數不足的問題。當系集樣本數不足(註一)時,除會引入取樣誤差外,更可能造成濾波器失敗(Filter Failure)。
  1. 較傳統的定義是指系集在動力模式中發展時,因樣本數不足,使得系集的差異性(離散度)不足,低估真實大氣的不確定性。這會讓EnKF認為此時的預報不確定性很低,模式已可掌握真實大氣的發展,也就不需過多的觀測資訊修正背景場。少了觀測資訊的修正,系集的離散度會隨著時間繼續下降,使得觀測資訊更難藉由同化過程修正背景場,最終致使系集收斂至模式動力特徵,完全背離真實大氣的狀態,導致濾波器發散(Filter Divergence)。 
  1. 另一種濾波器失敗稱作Catastrophic Filter Divergence(CFD),同樣是因系集樣本數不足造成。這種形態的濾波器失敗是模式在積分過程中,會於短時間內出現無限大的值(machine infinite),讓積分結果爆掉(blow-up),屬於數值不穩定造成的濾波器失敗。 
    Catastrophic Filter Divergence的觸發條件是:
  1. 觀測誤差很小,確保觀測資料一定會被使用。傳統的濾波器發散是因為觀測誤差相對背景誤差過大,使得觀測資訊無法被使用。而對CFD來說,反倒是需要很小的觀測誤差,除了確保觀測資訊一定會被使用外,因為觀測誤差很小,使得背景場會大幅度地朝觀測值靠攏。
  1. 需在特定的同化間隔(註二)才會觸發,當同化間隔過高或過低都不會觸發。若同化間隔過高,則分析場會非常接近觀測場;若同化間隔過高,則分析場會隨著積分過程而具有模式動力的特徵。但若是同化間隔不高也不低時,當獲得一個接近觀測值的分析場後,隨模式積分一小段時間,還沒獲得模式動力平衡時,又馬上被拉回觀測值。如此周而復始的在觀測值與模式動力平衡間來回調整將會誘發數值不穩定,進而讓結果在積分過程中爆掉(blow-up)。


註一:怎樣的系集樣本數才足夠?理論上,一個系統自身的不確定性可以用Lyaponov exponent來表示,假設某系統的Lyaponov vector是50,表示只要有50組獨立且有效的系集成員就可以表達此系統的不確定性。但實作上Lyaponov exponent 並不容易獲得,也沒有意義(因為NWP模式的複雜度太高,即便知道Lyaponov exponent 的大小,也沒有能力負擔相對應的系集數)。


註二:同化間隔是否適當取決於模式解析度與天氣系統的尺度。如氣候模式與雲解析度模式適用的同化間隔就不一樣。

<參考資料>
Harlim, J., and A. J. Majda, 2010: Catastrophic filter divergence in filtering nonlinear dissipative systems. Communications in Mathematical Sciences, 8, 27–43, doi:10.4310/cms.2010.v8.n1.a3.
Gottwald, G. A., and A. J. Majda, 2013: A mechanism for catastrophic filter divergence in data assimilation for sparse observation networks. Nonlinear Processes in Geophysics, 20, 705–712, doi:10.5194/npg-20-705-2013.


    濾波器失敗可以分為兩種不同型態: 
    這兩種濾波器失敗的型態雖都稱作濾波器發散(filter divergence),但對NWP而言,意義卻不太相同。第一種(傳統)濾波器發散發生時,模式仍能提供預報結果,只是預報結果完全背離真實大氣狀態,不具預報能力。若沒有仔細評估預報結果,可能會錯信預報結果。第二種濾波器發散是因為積分過程中引發的數值不穩定而造成。由於傳統的濾波器發散的發生有跡可循,可透過各種統計方法估計離散度或是透過背景誤差矩陣的擴張(Inflation)來避免。相對而言,第二種型態的濾波器發散就較難掌握,因此將就其觸發條件與發生原因進行討論。

    可以想像模式在積分時,是沿著模式動力的吸引子移動(達到模式動力的平衡),但因模式具有模式誤差,使得模式動力的吸引子並不相等於真實大氣狀態的吸引子,所以需要藉由資料同化將將預報從模式動力的吸引子拉向觀測值,以逼近真實大氣狀態的吸引子。(關於吸引子的概念,可以從Lorenz的蝴蝶圖想像,該圖具有兩個明顯的吸引子,可以類比左側的中心是模式動力吸引子,右側是真實大氣狀態的吸引子) 。因此若觀測資料無法被同化,將造成預報最終會收斂至模式動力的吸引子,完全遠離真實大氣狀態的吸引子,也就是第一種濾波器發散。若是觀測誤差很小,同化時,原本受模式動力影響的背景場會馬上移動到觀測附近,開始積分後又會從觀測附近朝模式動力的吸引子移動。如果同化間隔很小,代表預報結果剛從觀測值往模式動力吸引子移動沒多久,又馬上被拉回觀測值,因此能確保預報結果很貼近觀測值;若同化間隔很長,那就有足夠的積分時間將預報結果從觀測值拉回到模式吸引子。但當同化間隔介於兩者之間時,會造成預報已經在前往模式吸引子的路上,又突然被拉回觀測,然後再積分一小段後,又再被拉回觀測,使得預報不斷在模式吸引子與觀測間快速來回調整。這種快速且劇烈的調整使得積分過程變得相當不穩定(數值上),可能在某個同化完成後的積分過程就爆掉了。而且CFD並不是因為不穩定度累積超過某個門檻後觸發的產物,其發生機率是屬於Poisson Distribution,也就是隨機過程,並不能夠掌握何時會出現,因此在執行EnKF同化時,需特別注意同化間隔對於數值穩定度的影響。

沒有留言:

張貼留言