고해상도 격자 기후자료 내 이상 기후변수 수정을 위한 통계적 보간법 적용
Abstract
A long-term gridded historical data at 3 km spatial resolution has been generated for practical regional applications such as hydrologic modelling. However, overly high or low values have been found at some grid points where complex topography or sparse observational network exist. In this study, the Inverse Distance Weighting (IDW) method was applied to properly smooth the overly predicted values of Improved GIS-based Regression Model (IGISRM), called the IDW-IGISRM grid data, at the same resolution for daily precipitation, maximum temperature and minimum temperature from 2001 to 2010 over South Korea. We tested various effective distances in the IDW method to detect an optimal distance that provides the highest performance. IDW-IGISRM was compared with IGISRM to evaluate the effectiveness of IDW-IGISRM with regard to spatial patterns, and quantitative performance metrics over 243 AWS observational points and four selected stations showing the largest biases. Regarding the spatial pattern, IDW-IGISRM reduced irrational overly predicted values, i. e. producing smoother spatial maps that IGISRM for all variables. In addition, all quantitative performance metrics were improved by IDW-IGISRM; correlation coefficient (CC), Index Of Agreement (IOA) increase up to 11.2% and 2.0%, respectively. Mean Absolute Error (MAE) and Root Mean Square Error (RMSE) were also reduced up to 5.4% and 15.2% respectively. At the selected four stations, this study demonstrated that the improvement was more considerable. These results indicate that IDW-IGISRM can improve the predictive performance of IGISRM, consequently providing more reliable high-resolution gridded data for assessment, adaptation, and vulnerability studies of climate change impacts.
Keywords:
Improved GIS-based Regression Model, High-Resolution Gridded Climate Data, Inverse Distance Weighting Method1. 서 론
Coupled Model Intercompariosn Project Phase 5(CMIP5)에서는 전 세계 다양한 기후모형 개발그룹이 참여하여 기후변화에 기인한 영향평가를 위해 장기간의 기후정보를 제공하고 있다(Maloney et al., 2014). 최근 기후변화 영향평가는 주로 수자원, 농업, 경제 등 지역단위의 다양한 분야에 영향을 미치고 있으며, 지역 단위 기후요소의 시ㆍ공간적 분포특성을 이해하고자 고해상도의 기후정보에 대한 필요성이 점차 증가하고 있다(Wood et al., 2004; Eum et al., 2014). 우리나라는 복잡한 해안선과 더불어 국토의 65% 이상이 산악지형으로 이루어져 있으며, 계절풍의 영향으로 시공간적인 기후변동성이 크게 나타난다. 하지만 기후변화와 기상예측을 위한 관측자료는 대부분 300 m 이하 고도에 제한적으로 설치되어 있고, 불균등하게 분포하여 국지적인 기후특성을 정량적으로 분석하기에는 어려움이 있다(Hong et al., 2007; Ahn et al., 2014; Eum and Kim, 2015a).
고해상도의 기후정보를 위한 연구로 전지구모형(Global Climate Model, GCM)의 예측결과를 역학적ㆍ통계적으로 상세화하여 예측성능을 개선한 연구가 진행되는 추세이고(Leung et al., 2006; Qian et al., 2010; Wilby et al., 1998), 그 중 통계적 상세화 기법으로 격자형태의 관측자료를 활용한 고해상도 기후변화 예측정보를 생산하는 연구가 수행되고 있다(Maurer et al., 2010). 이를 위해 기존의 관측망을 활용한 고해상도 격자정보를 추정하는 Parameter-elevation Regression on Independent Slope Model(PRISM)을 활용한 연구가 해외와 국내에서 활발하게 진행 중이다. Daly et al.(1994)이 제안한 PRISM은 산악의 경사방향, 거리, 고도, 해양도 등의 인자를 고려한 효율적인 보간법을 제공하고 있다. 이러한 방법으로 미국의 월별 기온과 강수의 고해상도 기후 자료를 생산하였고(Daly et al., 2001; Kittel et al., 1997), 국내에서는 한반도의 지리정보를 PRISM의 계수와 영향반경, 해양도 및 지향면에 적용하여 K(Korean)-PRISM을 개발하였다(Hong et al., 2007). Hong et al.(2007)과 Sin et al.(2008)은 월평균 기간규모로 5 km × 5 km 해상도의 기온 및 강수량의 공간분포를 제시하는 연구를 수행하였다. 또한 Kim et al.(2012; 2013)은 1 km 해상도의 격자형 일 기상자료를 생산하였으며(Modified Korean-PRISM, MK-PRISM), 지역기후모델(Regional Climate Model, RCM)의 계통오차를 보정하는 데 활용하였다(Kim et al., 2012). Eum and Kim(2015a; 2015b)은 40년 이상의 장기 관측값이 존재하는 60개 종관기상관측점(Automated Synoptic Obsering System, ASOS)의 자료만을 사용하여 장기 고해상도 기후 격자자료를 생산하였고, 기존에 단일한 영향반경을 설정한 PRISM과 차별화하여 관측점의 밀도를 고려한 영향반경을 결정할 수 있는 기법을 적용하였다. 지리정보시스템(Geographic Information System, GIS) 기반의 회귀모형은 수치표고모델을 사용함에 따라 복잡한 지형에서 관측점의 개수가 충분치 않을 경우, 회귀모형의 기울기가 과도하게 산정되어 심각한 계통적 오차가 발생하는데, 이는 영향반경 내 균등한 관측점으로 인해 개선될 수 있다. 그러나 공간분포가 불균등하고 해상도가 낮은 ASOS 관측점만을 사용한 경우, 생성한 고해상도 기후자료의 극값이 과대 혹은 과소하게 산정되어 계통적 오차가 발생하게 된다(Hong et al., 2007; Sin et al., 2008). GIS 기반의 회귀모형과 더불어 자주 사용되는 통계적 보간법은 이러한 계통적 오차를 개선시키기 위한 후처리방법으로 적용가능성이 있다고 알려져 있다(Hwang and Ham, 2013; Ahn et al., 2014). 실제로 Eum and Kim(2015a; 2015b)에 의해 생성된 격자정보에서 지형이 복잡하고, 관측수가 적은 격자 주변에서 관측값과 비교했을 때 추정값이 과도하게 산정되어 심각한 오차가 발생한 지점이 발생했다.
따라서, 본 연구에서는 Eum and Kim(2015b)에 의해 개선된 GIS 기반의 회귀모형을 통해 생성된 3 km × 3 km 기후 격자정보를 대상으로 대표적인 공간 보간법인 역거리 가중방법을 적용하였다. 이를 통해 격자별 극값에 대한 계통오차를 줄임으로써 고해상도 기후 격자자료의 활용성을 높이기 위한 연구를 진행하고자 하였다. 연구에 사용된 GIS 기반의 회귀모형은 IGISRM(Improved GIS-based Regression Model)로 모형 입력자료로 사용된 ASOS가 아닌 자동기상관측자료(Automated Weather Station, AWS)를 이용하여 기후자료를 검증하였으며, 후처리 기법으로 통계적 보간법을 적용하여 기후정보의 예측성능 개선을 확인하고 활용가능성을 검증하였다.
2. 자료 및 연구방법
2.1 자료
본 연구에서 사용된 IGISRM은 적도기준 90 m의 해상도를 가진 미국 NASA의 Shuttle Radar Topographic Mission(SRTM) 수치표고모형(Digital Elevation Model, DEM)자료를 사용하여 IGISRM의 격자별 고도, 경사향, 해양도의 입력자료를 산정하였다. 1973년부터 관측되어 장기관측자료로 사용가능한 종관 기상관측자료인 ASOS 자료 중 결측값이 적은 60개 지점의 일강수량과 일최고ㆍ최저 기온을 IGISRM의 입력자료로 사용하였고, 위치를 Fig. 1에 나타내었다. Eum and Kim(2015b)은 계산효용성과 추정정확도를 고려한 격자해상도의 민감도분석을 실시하여 3 km × 3 km 공간해상도를 설정하였고, 1973년부터 2010년까지의 일강수 및 일최고, 최저기온자료를 생성하였다. 기존 PRISM 모형은 모든 격자에 단일한 영향반경을 설정하는 반면 IGISRM 모형은 각 격자점별 관측점의 밀도를 고려하여 영향반경을 결정하는 Daymet 모형(Thornton et al., 1984)과 GIS 정보를 활용하여 영향반경 내 관측점의 가중값을 결정하는 PRISM 방식(Dalyet al., 1994)으로 구성하였다. 격자별 영향반경(Rp)은 식 (1)과 식 (2)의 반복적인 계산을 통해 결정된다.
(1) |
(2) |
여기서 Dp는 관측점의 밀도, wi는 관측점 i의 가중값, 는 영향반경, Rp 이내의 거리에 대한 평균 가중치, α는 무차원 형상매개변수로 Thornton et al.(1984)에서 제시한 6.25로 설정하였다. 그리고 N은 영향반경 내 기대 관측점 갯수로 사용자에 의해 설정되는데, 본 연구에서는 영향반경 내 최소 5개가 포함되도록 설정하였다. 식 (1)과 (2)를 통해 산정된 격자별 영향반경을 사용하여 영향반경 내 관측점을 사용하여 식 (3)과 같이 거리, 고도, 경사향, 해양도 등과 같은 지형학적 유사성에 기인하여 가중값을 설정한 후, 식 (4)의 회귀식을 통해 각 격자점의 기후자료를 생성하게 된다. 이러한 식 (1)∼(4)와 같은 IGISRM의 일련의 과정이 모든 격자점에 대해 수행되어 격자자료를 생성하게 된다.
(3) |
(4) |
식 (3)의 wi는 관측점 i의 가중값으로 wr, wz, wf, wc는 각각 거리, 고도, 경사향, 해양도에 대한 가중치를 의미한다. Fr와 Fz는 수평 및 수직 거리의 상대적 중요성을 나타내는데, Daly et al.(2002)의 제안에 따라 각각 0.8, 0.2로 설정하였다. 또한 와 는 각각 격자점에서의 기후 추정값과 고도를 나타내며, β0와 β1은 회귀식의 경사와 절편을 나타내는데, 관측점의 가중값, 관측값(yi), 고도(zi), 가중평균 관측값( ) 및 고도()를 통해 산정된다.
기상청에서 제공하는 지표 관측자료는 종관기상관측자료인 ASOS와 자동기상관측자료인 AWS로 분류된다. 앞서 설명한 것과 같이 IGISRM 모형의 입력자료로 장기기상관측자료를 보유한 60개의 ASOS를 사용하였으며, 검증자료로 AWS의 일강수량, 일최고ㆍ일최저기온을 사용하였다. AWS 관측점은 주로 2000년 이후에 설치되어 관측기간이 ASOS에 비해 상대적으로 짧기 때문에 IGISRM을 통한 장기 격자자료 생성에 사용되지 않고, 검증자료로만 사용하였다. 국내 AWS 관측점은 600개가 넘어 약 12 km의 공간해상도를 가지고 있으나, 대부분 관측시점이 2000년 이후일 뿐만 아니라, 관측시점이 서로 상이한 것이 많았다. 또한 자료 중 결측값이 한 달 이상인 지점도 발견되었다. 따라서 본 연구에서는 AWS 자료 중 결측값이 적고 2001년부터 2010년까지의 분석기간 중 연속적인 자료 수집이 가능한 243개 지점을 검증에 사용하였고, Fig. 1 AWS 관측지점의 위치를 제시하였다.
2.2 연구방법
통계적 회귀모형 결과로 산출된 IGISRM의 고해상도 격자 자료의 활용도를 높이기 위하여 극한값을 보간하고자 공간분포의 통계적 보간법을 채택하였다. 본 연구에서 사용한 통계적 보간법은 일반적으로 영향반경 내의 모든 자료값에 동일한 가중치를 부여하는 지역평균법의 한계를 개선한 역거리 가중법(Inverse Distance Weighting, IDW)으로 거리에 따른 주변 값들의 가중값을 산정하여 가중평균을 통해 추정하고자 하는 지점의 값을 보간하는 방법이다(Kim et al., 2010). IDW 보간법은 대표적인 공간분포 보간법으로 관측점간의 거리에 반비례하여 가중치를 할당하고, 거리가 멀어짐에 따라 지수적으로 감소한다. 식 (5)에서 제시한 바와 같이, 거리에 따라 산정된 주변 격자에 대한 가중치를 사용하여 가중평균 함으로써 보간하는 방법이다.
(5) |
보간할 격자값(Zp)은 주변 격자값(Zi)에 가중치(W)를 적용하고, 이는 두 격자 사이의 거리(di)의 제곱에 반비례하여 계산된다. IGISRM의 일단위 격자 기후자료 중 임계값을 초과하는 극값의 주변 격자에 IDW 보간법을 적용하여 산출된 값으로 극값을 대체하고, 적용 결과를 IDW-IGISRM로 나타내었다. 이러한 IDW-IGISRM을 통해 Eum and Kim(2015b)에 의해 생성된 격자정보 중 과도하게 추정된 격자점을 대상으로 대상격자 주변값을 사용하여 통계오차를 감소시키려 하였다. IDW-IGISRM의 적용방식은 2.2.2에 상세히 설명하였다.
고해상도 격자 기후자료인 IGISRM의 극값에 통계적 보간법을 적용하기 위해 ASOS 관측자료를 기반으로 선정한 임계값을 초과하는 격자값을 선택하고, 주변격자 값에 역거리 가중방법을 적용한다. 기후요소별 임계값은 1973년부터 2010년까지 관측된 ASOS의 일강수량, 일최고기온과 일최저기온으로 산정하였다. IDW 보간법을 적용할 주변 격자값이 기상관측자료를 토대로 선정한 임계값을 초과하는 경우, 보간법 적용격자점에서 제외하여 반복적으로 임계값을 생성하는 것을 제한하였다. 예를 들어 Fig. 2 (a)의 P1∼P9개의 격자점 중 임계값을 초과한 격자값이 P5일 때 일반적인 방법으로 P5를 제외한 주변 8개의 값에 IDW를 적용하여 산출된 새로운 격자값이 P5로 대체된다. 그러나 (b)와 같이 P5의 주변 격자값 중 임계값을 초과하는 값이 P6과 P7 두 개가 동시에 존재할 경우, 해당 격자값을 제외한 8개 격자중 6개 격자값으로 IDW를 통해 P5의 값을 산정한다. 또한 수정된 값은 다음 임계값의 계산에 사용되므로 극값의 분포 밀도가 높은 지역에서의 활용성도 고려하였다. 일강수량의 임계값은 870 mm/day로 1973년부터 2010년까지 기상청 ASOS 관측값의 최대값으로 선정하였고, 일최고기온과 일최저기온도 동일한 기간동안 ASOS 관측값의 월별 최대ㆍ최소값을 임계값으로 설정하였으며, Table 1에 제시하였다.
본 연구에서 공간분포 보간법을 적용할 기후요소는 일강수량과 일최고ㆍ최저기온이다. 모든 기후 요소에 동일한 영향반경을 적용하기 위해 상대적으로 공간적 변동성이 큰 강수량을 대상으로 영향반경에 따른 민감도분석을 실시하였다. Fig. 3은 검증기간 중 243개의 AWS 전체 검증지점의 연강수량 평균을 나타내고 있으며, 2001년부터 2010년까지 평균 연강수량은 1,375.5 mm로 나타났다. 이 중 2003년의 평균 연강수량이 1,901.1 mm로 검증기간 중 가장 높게 나타나, 2003년에 대해 IDW 보간법의 영향반경 민감도 실험을 실시하였다.
3 km 수평해상도를 고려하여 3의 배수로 영향반경을 증가시켜, 3 km에서 30 km까지 총 10개 영향반경에 대해 전체 관측 지점의 편의(BIAS)와 평균오차제곱근(Root Mean Square Error, RMSE) 값의 변화를 살펴보았다. Fig. 4에서 영향반경이 증가하면서 RMSE가 증가하는 반면, BIAS는 IGISRM에 비해 상당히 감소되는 것을 확인할 수 있다. 또한 IGISRM에서는 양의 BIAS가 나타나고, IDW에서는 영향반경이 증가할수록 음의 값을 갖는 것을 확인할 수 있다. 일반적으로 IGISRM은 과대모의하는 경향이 있어 극값에 대해 좋은 예측성능을 보이며, 이러한 큰 값에 민감하게 반응하는 RMSE의 값은 상대적으로 양호하게 나타난다. 하지만 지형이 복잡하고 강수가 높은 사상을 보이는 경우, 비이상적으로 높은 값을 추정함으로써 큰 양의 BIAS가 나타나는 것으로 사료된다. 이러한 경우, IDW를 적용함으로써 이러한 비이상적인 값이 감소되어 BIAS가 크게 개선되나, RMSE는 다소 증가하는 것으로 나타났다. 전제적으로 BIAS와 RMSE를 동시에 고려했을 때 3 km의 영향반경을 적용한 경우 가장 좋은 성능을 나타냈다. 따라서 IDW에 가장 적합한 거리는 3 km로 확인되어, 본 연구에서 모든 기상변수 즉, 일강수와 일최고ㆍ최저기온에 대해 IDW 보간법을 적용하였다. 본 연구에서는 강수자료를 활용하여 최적 영향반경을 3 km로 설정하였지만, 강수에 비해 공간변동성이 상대적으로 적은 기온의 경우 다른 최적 영향반경이 산정될 수 있다. 그러나 본 연구에서는 강수자료에 의해 설정된 영향반경을 강수와 기온자료에 적용하여 IDW를 수행하였다.
2.3 검증 방법
고해상도 격자자료인 IGISRM는 3 km × 3 km의 공간해상도를 가지며, 일강수량, 일최고기온과 일최저기온의 변수를 포함하고 있다. IGISRM과 더불어 IDW 보간법을 일단위로 적용한 결과를 IDW-IGISRM로 정의하고, 검증기간인 2001년부터 2010년까지 각 격자별 연평균값(강수 및 최고ㆍ최저기온)을 산정하고, 이에 대한 공간분포를 제시하여 고해상도의 격자자료로 각 기상요소에 대한 지역적인 IDW 보간법의 효과를 살펴보고자 한다.
이와 더불어 AWS 관측자료와 비교를 위해 IGISRM과 IDW-IGISRM의 격자자료 중 검증에 사용된 243개의 AWS와 최근접 격자값을 추출하여 검증기간 동안 강수량과 최고기온, 최저기온에 대한 연평균값을 산정하였다. 그리고 관측값과 IGISRM 및 IDW-IGISRM 공간분포를 비교ㆍ분석하여 IDW보간법에 의한 공간적인 효과를 살펴보고자 한다.
통계분석을 위해 243개 AWS 전 지점의 기상요소 값과 IGISRM와 IDW-IGISRM의 최근접 격자값의 각 기상요소에 대해 다음의 5개 정량적 평가지표을 사용하여 예측성능을 검증하였다. 우선 ‘1’에 가까울수록 높은 상관성을 나타내는 상관계수(Correlation Coefficient, CC)와 일치도(Index Of Agreement, IOA)로 관측값과의 유사성을 확인하였다. 그리고 평균오차제곱근(RMSE)과 절대평균오차(Mean Absolute Error, MAE)로 오차범위를 분석하여 정량적인 검증값을 제시하였다. 검증에 사용된 평가지표는 아래 식 (6)∼(10)에 제시하였으며, N은 관측수, Pi와 Oi는 각각 시간 i의 추정값과 관측값을 나타낸다.
(6) |
(7) |
(8) |
(9) |
(10) |
IGISRM은 산악지대와 같이 복잡한 지형과 영향반경 내 관측점 개수와 같은 요소에 의해 극값 예측력이 크게 좌우된다. 검증기간 내 모든 AWS 관측지점 중 각 기상변수에 대해 관측값과 IGISRM의 차이가 가장 크게 나타나는 4개 AWS 지점을 선정하고, 이에 대해 면밀한 분석을 실시하였다. 즉, IDW보간법을 적용하기 전과 후를 비교하여 IDW-IGISRM의 효용성을 고찰하였다. 이를 위해, 선택 지점의 관측값과 IGISRM과 IDW-IGISRM의 추정값을 시계열로 제시하고, 앞서 소개한 정량적 평가지표를 산정하여 IDW-IGISRM의 효용성을 평가하였다.
3. 결 과
3.1 공간 분포
기상요소에 따른 3 km × 3 km의 고해상도 IGISRM과 IDW보간법을 적용한 IDW-IGISRM의 격자분포를 검증기간인 2001년부터 2010년까지 평균하여 Fig. 5에 제시하였다. 각 기상요소의 공간분포에서 고해상도 격자자료의 상세한 고도가 반영된 특징을 살펴볼 수 있다. 즉, IGISRM의 강수 추정치에 나타나는 연평균 강수량의 극값이 고도 차이가 큰 지역을 중심으로 나타나고(Fig. 5 (a)), IDW-IGISRM의 분포에서 상쇄되는 것을 확인할 수 있다(Fig. 5 (b)). Fig. 5 (c)와 (d)에 제시된 Tmax에 대한 IGISRM과 IDW-IGISRM의 공간분포 차이는 전반적으로 다른 기상요소에 비해 상대적으로 작게 나타났으나, 고도와 반비례하는 기온의 특징이 잘 나타남을 확인할 수 있다. 충청남도 해안의 산악과 경상북도 태백산맥의 부근으로 분포의 차이가 확인된다. 또한 Tmin의 IGISRM과 IDW-IGISRM의 공간분포 차이가 나타나는 지역은 Tmin의 공간분포와 유사하였으나, IDW 보간법 적용 후 상쇄 효과가 더 두드러지게 나타났다. 이는 Tmax의 극값은 El Niño Southern Oscillation(ENSO), Pacific Decadal Oscillation(PDO)와 같은 큰 규모의 순환장에 의한 영향으로 발생하는 경우가 많으나(Christensen et al., 2013), Tmin의 극값은 고도, 지표 상태와 같은 지형학적 요소에 의한 영향을 많이 받는 것으로 사료된다(Eum et al., 2014). 즉, Fig. 5 (c)∼(f)에서 나타난 바와 같이 Tmin이 Tmax에 비해 국내 지형학적 요소에 의한 공간변동성이 훨씬 크기 때문에 IDW로 인한 극값의 상쇄 효과가 더 두드러지게 나타나는 것으로 판단된다.
Fig. 6는 AWS 관측자료와 비교를 위해 IGISRM과 IDWIGISRM의 격자자료 중 검증에 사용한 243개의 AWS와 최근 접 격자값을 추출하여 관측지점과 비교한 공간분포 지도를 나타낸다. 이는 243개 AWS 관측지점에 의한 공간분포이므로 3 km 격자자료를 사용한 Fig. 5에 비해 공간분포의 세밀함이 감소되었다는 점에 주의하여야 한다. 연평균 강수량의 경우, 관측값(Fig. 6 (a))과 IGISRM 격자 추정값(Fig. 6 (b))은 전라도와 강원도 지역의 최대값의 분포에서 많은 차이가 있었으나, IDW 보간법을 적용한 IDW-IGISRM(Fig. 6 (c))는 IGISRM의 과대 추정된 극값이 적절히 상쇄되어 나타났다. 연평균 최고기온의 분포는 IGISRM과 IDW-IGISRM의 격자 추정값보다 관측값에서 공간적 변동성이 크게 나타났으며, IDW 보간법의 적용효과는 상대적으로 작게 확인되었다(Fig. 6 (d)∼(f)). 최저기온의 연평균 분포는 관측값과 IGISRM 격자 추정 값의 차이가 강원도 내륙과 경상북도 남부의 태백산맥 부근, 전라도의 노령산맥 서쪽 부근으로 크게 나타났으며, IDW에 의한 상쇄 효과로 인해 관측값에 대한 공간분포가 다소 개선됨을 확인하였다.
이와 더불어 AWS 관측값에 대한 IGISRM과 IDW-IGISRM의 추정 격자값을 비교하기 위해 검증기간동안 각 기후변수의 연 평균값에서 243개 전체 지점의 평균과 243지점 중 최대, 최소값을 Table 2에 나타내었고 관측과의 차이를 괄호에 표시하였다. 연평균 강수량의 경우, IGISRM은 평균, 최대, 최소값에서 양의 차이가 나타났고, IDW-IGISRM은 최소값을 제외하고 음의 차이가 나타났다. 이는 IDW 보간법으로 IGISRM으로부터 과도하게 추정된 극값을 감소시켜 나타난 결과로 사료된다. 또한 연평균 강수량에 대한 차이의 절대값을 살펴보면 IGISRM은 950.4 mm/year인 반면, IDW-IGISRM은 177.2 mm/year로 773.2 mm가 감소되는 것으로 나타났다. 일최고기온의 경우, IGISRM과 IDW-IGISRM의 추정값이 상대적으로 근소한 차이를 보였다. 일최저기온에 대해서 최소값에 대한 IGISRM과 IDW-IGISRM의 추정값의 차이가 -7.0℃에서 -2.8℃로 감소하는 것을 확인하였다. 이는 앞서 언급한 바와 같이 기후변수별 지형학적 영향에 따라 IDW 보간법의 효과가 다르게 나타나기 때문인 것으로 사료된다.
3.2 통계 검증
243개 AWS의 관측값과 IGISRM 및 IDW-IGISRM의 최근접 격자값을 추출하여 평가지표를 산정하고, 각 기법별 예측 성능을 정량적으로 검증하고자 하였다. Fig. 7에서 검증기간 동안 각 기상변수의 연평균에 대해 IGISRM와 IDW-IGISRM의 평가지표를 AWS 관측지점별로 산정한 후, 이를 평균한 값을 제시하였다. 각 평가지표별로 상이한 단위를 고려하기 위해 강수량의 MAE와 RMSE는 정규화하여 제시하였다. 모든 기상변수에 대하여 IDW 보간법 적용하여 일치도(CC, IOA)가 증가하고, 오차(MAE, RMSE)가 감소하는 등 예측성능이 향상됨을 확인하였다. 좀 더 정량적인 비교를 위해 Table 3과 같이 각 평가지표를 도표화하여 제시하였다. 여기서, IDW 보간법 적용 후 개선된 차이를 백분율로 괄호 안에 제시하였다. 연평균강수량(Prcp)의 경우, IDW 보간 적용효과는 CC에서 6.4% 증가하는 것으로 나타났고, IOA에서 0.7% 증가하는 것으로 확인되었다. MAE와 RMSE의 경우, 각각 4.8%와 10.8%로 오차를 개선시키는 것으로 나타났다. 연평균 최고기온(Tmax)에 대한 IDW 보간법 적용 후 CC와 IOA는 각각 4.0%와 1.3%로 증가하였고, MAE와 RMSE는 3.3%, 4.0% 감소하는 것을 확인하였다. 앞에서의 결과와 마찬가지로 모든 기상변수 중 Tmin의 예측성능 개선이 가장 적게 나타났다. 연평균 최저기온(Tmin)의 경우 IGISRM의 CC와 IOA는 각각 11.2%와 2.0% 증가하였고, MAE와 RMSE는 각각 5.4%, 15.2% 감소하여 예측성능이 상대적으로 크게 개선됨을 확인하였다.
월단위의 결과는 일치도와 오차의 검증을 위한 평가지표로 CC와 RMSE를 사용하였고, Fig. 8에 제시하였다. 강수의 RMSE는 기온과 상이한 단위를 고려하기 위해 정규화하여 제시하였다. 모든 기후변수의 IDW 보간 적용효과는 월별로 다르게 나타났다. Fig. 8(a)에 제시된 상관관계를 살펴보면 IDW 보간법 적용 후 9월과 10월의 강수(Prcp)의 경우 상관관계가 다소 감소하였으나 차이가 매우 미미하였고, 대부분 기간 중 일치도가 향상되었음을 확인하였다. 특히 여름철인 6∼8월의 개선 효과가 가장 크게 나타났다. 기온의 경우 모든 기간에서 IDW보간 적용효과를 확인할 수 있었으며, 특히 최고기온(Tmax)은 5∼9월, 최저기온(Tmin)은 10∼2월의 개선 정도가 다른 월에 비해 크게 나타났다. Fig. 8(b)에 제시된 RMSE를 살펴보면 대부분의 월에서 IGISRM에 비해 IDW-IGISRMd의 RMSE가 감소하였다. 특히, 집중호우가 발생하는 7월과 8월의 RMSE가 상대적으로 크게 개선됨을 확인하였다. 일최고기온에서는 모든 월에서 RMSE가 감소하나 그 효과가 미미하였다. 그러나 일최저기온에서는 일교차가 커지는 1∼4월과 10∼12월에 개선효과가 크게 나타남을 확인하였다.
3.3 지점 분석
검증기간 중 각 기상변수별 IGISRM의 오차가 크게 나타나는 상위 4개 지점을 선택하여 IDW-IGISRM의 효과를 비교하고자 하였다. 각 기상변수별 IGISRM 오차의 상위 4개 지점은 다소 중복되어 나타났으며, 분석에 사용된 지점은 419(서울시 중구), 500(인천시 강화군), 730(전남 장성군), 817(경북 영양군), 829(경북 경주시), 836(경북 청송군), 951(전북 정읍시)이다. Fig. 9는 선택된 4개 지점에 대한 기상변수별 관측값과 IGISRM, 그리고 IDW-IGISRM의 연평균자료에 대한 시계열을 제시하였으며, 각 지점별 평가지표를 산정한 후 이에 대한 평균값을 Table 4에 제시하였다. 연평균 강수량의 경우, IGISRM의 과대 추정값이 IDW-IGISRM를 통해 CC가 22.9% 개선되는 것으로 확인되었다. MAE와 RMSE는 각각 58.12%와 53.0% 오차를 개선시키는 것으로 나타났다. 연평균 최고기온의 경우, IGISRM의 추정값을 IDW-IGISRM에서 감쇄시키는 것으로 확인되었으나, Fig. 9 (b)의 stn 730의 경우와 같이 IGISRM가 관측값에 비해 과소 추정하는 경우에는 오히려 오차가 증가하는 것으로 나타났다. 그러나 전반적으로 Table 4를 보면 CC가 4.1%, MAE와 RMSE는 각각 29.1%, 29.3% 개선되는 것을 확인하였다. 앞선 연구결과, 최저기온의 격자 추정값의 관측값과의 차이가 최고기온에 비해 크게 나타났으며(Table 2), 이는 Fig. 9(c)에서도 확인할 수 있다. 검증지점에 따라 과소 추정된 IGISRM의 최저기온값이 IDW보간 적용 결과, 관측값의 수준으로 개선된 사례(stn 500, stn 836)와 개선 효과가 미비한 사례(stn 951, stn 829)가 동시에 확인되었다. 이를 개선하기 위해서는 다양한 지형조건을 가진 관측점의 추가가 필수적이며, 본 연구를 바탕으로 추가 관측점의 우선순위 등을 설정하는 계기가 될 수 있을 것으로 기대된다.
4. 요약 및 결론
본 연구에서는 국내 60개 ASOS 관측값을 사용한 GIS 기반 회귀모형인 IGISRM의 고해상도 격자 기후자료를 과도하게 추정된 극값을 보정하기 위한 IDW 보간법을 적용하여 IDW-IGISRM 격자자료를 생산하였다. IDW 보간법의 영향반경을 설정하기 위해 3 km에서 30 km까지 다양한 값에 대한 민감도 분석을 실시하였고, 3 km를 최적의 영향반경으로 설정하였다. IDW-IGISRM을 통해 보정된 격자자료는 검증기간(2001∼2010년) 동안 공간분포, 4가지 평가지표, 그리고 IGISRM의 오차가 가장 큰 4개 지점에 대한 평가지표 등 3가지 관점에 대해 AWS 관측자료와 비교하여 개선된 모형의 효용성을 검증하고자 하였다.
첫 번째로 공간분포에 대해 연평균 강수량의 극값은 고도차이가 큰 지역을 중심으로 나타났고, 연평균 최고ㆍ최저기온은 고도에 반비례하는 분포를 보였다. 각 기상변수에서 IGISRM의 극값 추정값이 IDW-IGISRM의 격자분포에서 감소되는 것을 확인하였다. 이와 더불어 IGISRM와 IDW-IGISRM의 격자자료 중 243개의 AWS와 최근접 격자값을 산출하여 AWS 관측자료와 비교하였다. 그 결과, 지형학적 특성의 영향을 많이 받는 강수량과 최저기온의 경우, IGISRM의 과대모의에 대한 개선효과가 나타났으나, 주로 광역규모 기후패턴의 영향을 받는 최고기온에 대해서는 IDW 보간법의 적용효과가 상대적으로 적게 나타남을 확인하였다. IDW 보간법 적용결과, 관측자료와의 극소값, 극대값, 평균값의 오차범위가 개선되는 결과를 보였다. 최고기온과 최저기온의 IDW 적용격자는 평균적으로 각각 202개(0.015%)와 185개(0.014%)로 확인되었다.
이 연구에서는 IGISRM과 IDW-IGISRM에 대해 4가지 평가지표를 산정하여 각 모형별 예측성능을 검증하였다. IDW보간법 적용 결과, IGISRM보다 일강수량, 일최고ㆍ최저기온의 CC 값이 4.0∼11.2% 증가하였고, IOA도 0.7∼2.0% 개선되었다. 또한 MAE와 RMSE는 각각 3.3∼5.4%, 4.0∼15.2% 감소함을 확인하였다. IGISRM과 IDW-IGISRM 두 모형 모두 관측과 일치도와 오차범위가 기존연구 결과(Kim et al., 2012)를 참조하였을 때 신뢰할만한 수준으로 판단되었고, IDW 보간법의 효과도 확인되었다. 그리고 월 평균 검증을 통해 강수량은 여름철에 그리고 일최저기온은 일교차가 커지는 1∼4월, 10∼12월에 IDW 보간 적용효과가 상대적으로 크게 나타남을 확인하였다.
이 연구에서는 검증기간 중 각 기상변수별 IGISRM의 오차가 크게 나타나는 상위 4개 지점에 대해 정량적 평가지표를 통한 모형 검증을 실시하였다. 그 결과, 일강수량, 최고 최저기온의 CC, MAE, RMSE가 각각 4.1∼22.9%, 29.1∼58.1%, 29.3∼53.0% 개선되었다. 이를 통해, GISRM의 오차가 크게 나타나는 지점에 대해 IDW-IGISRM의 효용성이 더 크게 나타남을 확인하였다. 또한 IDW-IGISRM을 통한 개선효과는 공간적 변동성이 크며, 지형학적 특성의 영향을 많이 받는 강수량에서 가장 크게 나타났으며, 광역규모 기후패턴의 영향을 받는 일최고기온에서 가장 적게 나타남을 확인하였다.
이 연구에서는 IDW-IGISRM을 통해 정확도를 크게 개선하였고, 공간분포 예측성능 향상을 도모하였다. 이러한 고해상도 격자자료는 지역기후모델의 검증을 위한 입력자료로 매우 유용하게 사용될 것이다. 더 나아가 전지구모형의 통계적 상세화를 위한 기초자료로 활용되어 국내 기후변화 영향평가 및 적응, 취약성 연구에 유용하게 활용될 수 있을 것으로 기대된다.
Acknowledgments
본 연구는 APCC의 지원 및 국토교통부 물관리사업의 연구비 지원 (14AWMP-B082564-01)을 통해 수행되었습니다.
REFERENCES
- Christensen, J, Kumar, KJ, Aldrian, E, An, SI, Cavalcanti, IFA, De Castro, M, Dong, W, Goswami, P, Hall, A, Kanyanga, JK, Kitoh, A, Kossin, J, Lau, M-C, Renwick, J, Stephenson, DB, Xie, SP, Zhou, T, (2013), Climate phenomena and their relevance for future regional climate change. Climate Change 2013: The physical science basis. Contribution of working group I to the fifth assessment report of the Intergovernmental Panel on Climate Change, Stocker, Cambridge University Press, p1217-1308.
- Daly, C, Neilson, RP, Phillips, DL, (1994), Astatistical-topographic model for mapping climatological precipitation over mountainous terrain, Journal of Applied Meteorology and Climatology, 33, p140-158. [https://doi.org/10.1175/1520-0450(1994)033<0140:ASTMFM>2.0.CO;2]
- Daly, C, Gibson, WP, Taylor, GH, Johnson, GL, Pasteris, P, (2002), A knowledge-based approach 12 to the statistical mapping of climate, Climate Research, 22, p99-113. [https://doi.org/10.3354/cr022099]
- Daly, C, Neilson, RP, Phillips, DL, (2007), A statistical-topographic model for mapping climatological precipitation over mountainous terrain, Journal of Applied Meteorology, 33:, p140-158. [https://doi.org/10.1175/1520-0450(1994)033<0140:ASTMFM>2.0.CO;2]
- Eum, HI, Gachon, P, Lapris, R, (2014), Developing a likely climate scenario from multiple regional climate model simulations with an optimal weighting factor, Climate Dynamics, 43, p11-35. [https://doi.org/10.1007/s00382-013-2021-4]
- Eum, HI, Kim, JP, (2015a), Generation of high-resolution gridded climate variables using modified PRISM over South Korea, Proceedings of the Spring Meeting of Korea Water Resource Association, p10-13, (in Korean with English abstract).
- Eum, HI, Kim, JP, (2015b), Long-term high-resolution gridded climate data derived from an improved GIS-based regression technique: Case study for South Korea, Journal of Hydrology: Regional Studies, submitted.
- Hong, KO, Suh, MS, Rha, DK, Chang, DH, Kim, CS, Kim, MK, (2007), Estimation of high resolution gridded temperature using GIS and PRISM, Atmosphere, 17(3), p255-268, (in Korean with English abstract).
- Hwang, SH, Ham, DH, (2013), Evaluation of spatial downscaling methods for enhancement of spatial precipitation estimation, Journal of Korean Society of Hazard Mitigation, 13(4), p149-163, (in Korean with English abstract). [https://doi.org/10.9798/KOSHAM.2013.13.4.149]
- Kim, D, Ryu, D, Choi, Y, Lee, W, (2010), Application of kriging and inverse distance weighting method for the estimation of geo-layer of Songdo area in Incheon, Journal of Korean Geotechnical Society, 26(1), p5-19.
- Kim, JP, Lee, WS, Cho, HG, Kim, GS, (2014), Estimation of high resolution daily precipitation using a modified PRISM model, Journal of the Korean Society of Civil Engineers, 34(4), p1139-1150, (in Korean with English abstract). [https://doi.org/10.12652/Ksce.2014.34.4.1139]
- Kim, JW, Kim, MK, Kim, S, Kim, YH, Han, MS, Lee, WS, (2012), High resolution climate change scenario based PRIDE model in South Korea, Proceedings of the Spring Meeting of Korean Meteorological Society, p127-128.
- Kim, MK, Lee, DH, Kim, JW, (2013), Production and validation of daily grid data with 1km resolution in South Korea, Journal of Climate Research, 8(1), p13-25, (in Korean with English abstract).
- Kim, MK, Han, MS, Jang, DH, Baek, SG, Lee, WS, Kim, YH, Kim, S, (2012), Production technique of observation grid data of 1km resolution, Journal of Climate Research, 7(1), p55-68, (in Korean with English abstract).
- Kittel, T, Royle, J, Daly, C, Rosenbloom, N, Gibson, W, Fisher, H, Schimel, D, Berliner, L, (1997), A gridded historical (1895-1993) bioclimate dataset for the conterminous United States, Proceedings of the 10th Conference on Applied Climatology(American Meteorological Society), p219-222.
- Leung, LR, Kuo, YH, Tribbia, J, (2006), Research needs and directions of regional climate modeling using WRF and CCSM, Bulletin of the American Meteorological Society, 87, p1747-1751. [https://doi.org/10.1175/BAMS-87-12-1747]
- Maloney, ED, Camargo, SJ, Chang, E, Colle, BC, Fu, R, Geil, KL, Hu, Q, Jiang, X, Johnson, N, Karnauskas, KB, Kinter, J, Kirtman, B, Kumar, S, Langenbrunner, B, Lombardo, K, Long, LN, Mariotti, A, Meyerson, JE, Mo, KC, Neelin, JD, Pan, Z, Seager, R, Serra, Y, Seth, A, Sheffield, J, Stroeve, J, Thibeault, J, Xie, SP, Wang, C, Wyman, B, Zhao, M, (2014), North American Climate in CMIP5 experiments: Part III: Assessment of twenty-first century projections, Journal of Climate, 27, p2230-2270. [https://doi.org/10.1175/JCLI-D-13-00273.1]
- Maurer, EP, Hidalgo, HG, Das, T, (2010), The utility of daily large-scale climate data in the assessment of climate change impacts on daily streamflow in California, Hydrology and Earth System Sciences, 14, p1125-1138. [https://doi.org/10.5194/hess-14-1125-2010]
- Qian, JH, Lareef, Z, (2010), The effect of grid spacing and domain size on the quality of ensemble regional climate downscaling over South Asia during the Northeasterly Monsoon, Monthly Weather Review, 138, p2780-2802. [https://doi.org/10.1175/2010MWR3191.1]
- Shin, SC, Kim, MK, Suh, MS, Rha, DK, Jang, DH, Kim, CS, Lee, WS, Kim, YS, (2008), Estimation of high resolution gridded precipitation using GIS and PRISM, Atmosphere, 18(1), p71-81, (in Korean with English abstract).
- Thornton, P, Running, SW, White, MA, (1997), Generating surfaces of daily meteorological variables over large regions of complex terrain, Journal of Hydrology, 190, p214-251. [https://doi.org/10.1016/S0022-1694(96)03128-9]
- Wilby, LR, Wigley, TML, Conway, D, Jones, PD, Hewitson, BC, Main, J, Wilks, DS, (1998), Statistical downscaling of general circulation model output: A comparison of methods, Water Resources Research, 34(11), p2995-3008. [https://doi.org/10.1029/98WR02577]
- Wood, AW, Leung, LR, Sridhar, V, Lettenmaier, DP, (2004), Hydrologic implications of dynamical and statistical approaches to downscaling climate model outputs, Climatic Change, 62, p189-216. [https://doi.org/10.1023/B:CLIM.0000013685.99609.9e]