The Korean Society of Climate Change Research

[ Article ]

Journal of Climate Change Research - Vol. 16, No. 5-2, pp.1061-1079

ISSN: 2093-5919 (Print) 2586-2782 (Online)

Print publication date 31 Oct 2025

Received 31 Aug 2025 Revised 10 Oct 2025 Accepted 22 Oct 2025

DOI: https://doi.org/10.15531/KSCCR.2025.16.5.1061

국가단위 기후변화 영향·취약성 평가를 위한 대리모델 기반 체계 구축 및 농업 부문 적용사례 연구

최순군^*

; 김태곤^**

; 이준혁^***

; 양예린^****

; 전상민^*

; 엽소진^*

; 이종문^*****

; 이병모^******

; 나영은^******^{, †}

*국립농업과학원 기후변화평가과 농업연구사
**전북대학교 스마트팜개발학과 조교수
***㈜노트스퀘어 대표
****국립농업과학원 기후변화평가과 석사후연구원
*****국립농업과학원 기후변화평가과 박사후연구원
******국립농업과학원 기후변화평가과 농업연구관

A surrogate model-based framework for national-scale assessment of climate change impacts and vulnerabilities: A review with applications in the agricultural sector

Choi, Soon-Kun^*

; Kim, Taegon^**

; Lee, Junhyuk^***

; Yang, Yerin^****

; Jun, Sang-Min^*

; Yeob, Sojin^*

; Lee, Jong-Mun^*****

; Lee, Byung-Mo^******

; Na, Young-Eun^******^{, †}

*Research Scientist, Climate Change Assessment Division, National Institute of Agricultural Sciences, Wanju, Korea
**Assistant Professor, Department of Smart Farm, Jeonbuk National University, Jeonju, Korea
***Chief Executive Officer, Notesquare Inc., Seoul, Korea
****Research Associate, Climate Change Assessment Division, National Institute of Agricultural Sciences, Wanju, Korea
*****Postdoctoral Researcher, Climate Change Assessment Division, National Institute of Agricultural Sciences, Wanju, Korea
******Senior Research Scientist, Climate Change Assessment Division, National Institute of Agricultural Sciences, Wanju, Korea

Correspondence to: ^† youngman99@korea.kr (55365, 300 Nongsangmyeong-ro, Jeonju, Jeollabuk-do, Korea. Tel. +82-63-238-2481)

Abstract

Climate change poses serious threats to agricultural productivity and environmental sustainability, highlighting the need for scientific, evidence-based quantitative assessments. Process-based models provide scientific reliability in simulating crop growth, hydrological processes, and greenhouse gas emissions; however, their application to high resolution, national scale assessments across multiple climate scenarios demands substantial computational resources, thereby limiting the timeliness of policy analysis and decision making. To address this challenge, this study outlines a surrogate modeling framework that links process-based models with machine learning techniques. The concept and classification of surrogate models are reviewed, including data-driven models, meta-models, and hybrid and multi fidelity models. In addition, recent applications are examined to identify the purposes for which surrogate modeling techniques have been applied in combination with process-based models. Based on these insights, a national-scale assessment framework is proposed that integrates large scale input-output data generation, sensitivity analysis, dimensionality reduction, and uncertainty quantification techniques. The framework also utilizes outputs from multiple General Circulation Models (GCMs), thereby reducing assessment uncertainty and improving the reliability of results. This review suggests that combining the scientific reliability of process-based models with the efficiency of surrogate models provides a promising and scalable framework for future climate impact and vulnerability assessments, which could serve as a valuable tool for adaptation planning and effective national policy making in the agricultural sector.

Keywords:

Machine Learning, Process-Based Model, Meta-Model, Agriculture, Vulnerability Assessment

1. 서론

기후변화와 이로 인한 이상기상 발생 빈도 증가는 작물 생산량 감소 및 불확실성 증대(Antón et al., 2013; van der Veer et al., 2024), 물과 토양 자원의 질 저하(Droste et al., 2020; Niroula et al., 2023) 등 농업 생산성과 환경에 중대한 영향을 미치고 있다. 이러한 영향은 국가와 지자체의 농업부문의 적응 대책 수립을 어렵게 하고, 식량안보와 농업 기반시설 유지·관리에도 직접적인 위협이 되고 있다(Parker et al., 2019).

기존의 농업 기후변화 취약성 평가는 주로 지표 기반(indicator-based) 접근법에 의존해왔다. 이 방법은 민감도(sensitivity), 노출(exposure), 적응역량(adaptive capacity)의 세 가지 축을 중심으로 사회경제적·환경적 지표를 정량화하고, 이를 가중 평균하여 최종 취약성 지수를 산출하는 방식이다(IPCC, 2001). 한국환경정책평가연구원(Korea Environment Institute, KEI)은 지역 단위의 정량적 취약성 평가를 위해 VESTAP (Vulnerability Evaluation Support Tool for Adaptation Planning)을 개발하였으며, 이는 지표 기반 구조에 기반하되 지리정보시스템(Geographic Information System, GIS) 및 통계기법을 통합하여 시군구별 기후노출 및 적응역량 평가를 가능하게 하였다(Oh et al., 2017). 한편, 이러한 체계는 데이터 요구 수준이 낮고 직관적인 비교 분석이 가능하다는 점에서 실용적이지만, 실제 농업 시스템 내 작물–기후–경영의 상호작용과 같은 동적, 비선형적 변화를 반영하는 데에는 한계가 있다(Varadan and Kumar, 2015). 특히 농업은 다양한 기후 요인에 영향을 받아 타 분야에 비해 기후변화에 취약하고 다양한 요인이 복합적으로 작용하는 시스템적 성격을 가지므로 효과적인 농업정책의 수립과 적응 대책 마련을 위해서는 과학적 근거와 정량적 데이터에 기반한 평가 체계 구축이 필요하다(Aleksandrova et al., 2016; Fellmann et al., 2012; Hossain et al., 2023; Tao et al., 2011).

이에 따라 과정기반모델(Process-Based Model, PBM)을 중심으로 한 모델 기반(model-based) 평가로의 전환이 이루어지고 있다. KEI의 MOTIVE (Model Of InTegrated impact and Vulnerability Evaluation)는 작물 생산, 수문, 생태계, 건강 등 다양한 부문에 대해 RCP 기반의 고해상도 기후 시나리오와 과정 기반 모델을 연계하여 통합적으로 평가하는 체계이다(Hong et al., 2021). 그러나 평가에 사용되는 PBM은 계산 비용이 높고, 반복 시나리오 평가에는 비효율적이라는 단점이 존재한다. 따라서, 최근에는 MOTIVE와 같은 시스템 내에 PBM과 머신러닝 등의 추정 기술을 활용한 대리모델(surrogate models)을 통해 계산 효율성을 확보하려는 시도가 요구되고 있다(Choi et al., 2024). 특히 기후변화에 따른 수확량 감소와 적응 시나리오별 효과를 수천 개 단위로 평가해야 하는 정책 분석에서는, 이와 같은 대리모델 기반의 접근이 실질적인 해법으로 부상하고 있다(Khan et al., 2024).

따라서 본 논문의 목적은 국가 단위의 기후변화 영향 및 취약성 평가에서 발생하는 연산 부담을 완화하고, 다양한 시나리오 분석을 가능하게 하는 대리모델 기반 접근의 활용 가능성을 고찰하는 데 있다. 이를 위해 PBM과 대리모델의 연계 절차를 정립하고, 실제 농업 생산성, 수문·수질, 온실가스 평가 등에 적용 사례를 탐색하고 방법론을 제안하고자 한다.

2. 과정기반모델의 적용과 한계

과정기반모델(Process-Based Model, PBM)은 농업 시스템을 정량적으로 이해하고 예측하기 위해 개발되어 활용되고 있다. 이러한 모델들은 작물 생육, 수문·수질, 토양의 탄소 및 질소·인 동태 등의 매커니즘을 구현함으로써 기후변화와 농업 관리의 영향을 체계적으로 분석할 수 있도록 하며, 각각의 특성과 강점을 바탕으로 광범위하게 이용되고 있다. 대표적인 작물 생육 모델에는 DSSAT (Decision Support System for Agrotechnology Transfer) (Jones et al., 2003), APSIM (Agricultural Production Systems Simulator) (McCown et al., 1996), ORYZA (Bouman et al., 2001), AquaCrop (Steduto et al., 2009)이 있으며, 수문·수질 평가 모델에는 SWAT (Soil and Water Assessment Tool) (Arnold et al., 1998), APEX (Agricultural Policy/Environmental eXtender) (Williams et al., 2008), 탄소 및 온실가스 모델에는 DayCent (Parton et al., 1998), DNDC (Denitrification-Decomposition) (Li et al., 1992)가 있다.

2.1. 작물생육모델

DSSAT 모델은 University of Hawaii와 International Fertilizer Development Center (IFDC)에서 개발하였으며, 국제 연구 협력을 통해 지속적으로 확장되었다(Jones et al., 2003). DSSAT는 여러 작물 모델 — CERES (Crop Environment Resource Synthesis) (Ritchie et al., 1989), CROPGRO (Boote et al., 1998) 등 — 을 통합하여 다양한 작물에 따른 작물 생산량, 생육단계 예측 등의 정밀한 평가가 가능하며, 기후변화 시나리오 적용을 통한 장기적인 시뮬레이션에 활용할 수 있다(Gunawat et al., 2022; Wang et al., 2009).

APSIM 모델은 호주 CSIRO (Commonwealth Scientific and Industrial Research Organisation), Queensland DPI, University of Queensland이 공동 개발한 모델이다. APSIM은 작물-토양-경작 관리의 상호작용을 정밀하게 모의할 수 있으며 다양한 작부체계와 기후조건을 반영한 장기 시뮬레이션이 가능하다(McCown et al., 1996; Sarkar et al., 2021).

ORYZA 모델은 네덜란드의 Wageningen University & Research와 IRRI (International Rice Research Institute) 협력으로 개발되었다. 최초 모델인 ORYZA1 (Kropff et al., 1993)에서 발전하여 ORYZA2000으로 통합되었으며, 가장 최근에는 ORYZA v3가 발표되었다. ORYZA는 다양한 조건에서 벼의 생육과 수확량 모의가 가능하여 재배 환경에 따른 벼 생산성 평가에서 강점을 가지며, 기후변화 및 담수, 관개와 같은 물관리 연구에서도 활용된다 (Bouman et al., 2001; Li et al., 2017).

AquaCrop 모델은 유엔식량농업기구(Food and Agriculture Organization of the United Nations, FAO)에서 개발한 모델로, 단순한 구조와 제한된 입력 변수로 수자원과 작물 생산성 관계를 정밀하게 분석할 수 있다는 강점을 가진다. 특히, 물 생산성(water productivity)에 중심을 두고 있어 가뭄, 수자원 관리 연구에 최적화되어 있다(Heng et al., 2009; Raes et al., 2009).

2.2. 수문･수질 평가모델

SWAT 모델은 USDA-ARS (United States Department of Agriculture – Agricultural Research Service)에서 개발한 유역단위 수문·수질 모델이다. SWAT은 대규모 유역의 수문 순환, 토양 침식, 양분 이동, 수질 변화를 통합적으로 모의 가능하며, 장기 모의와 토지이용변화, 다양한 농경지 관리 시나리오 평가에서 강점을 가진다(Arnold et al., 1998; Ficklin et al., 2013). 최근에는 SWAT 모델의 구조를 객체 지향 방식으로 개선하고 유역 내 하천, 저수지, 운하 등과 상호작용을 강화한 SWAT+ 모델이 등장하였고, 지하수 모듈과 결합한 SWAT+gwflow 모델(Abbas et al., 2024), 논 모듈과 결합한 SWAT+Paddy 모델 (Jeong et al., 2025), 글로벌 고해상도 모델인 CoSWAT (Chawanda et al., 2025) 등이 개발되었다.

APEX (Agricultural Policy/Environmental eXtender) (Williams et al., 2008) 모델은 EPIC (Erosion-Productivity Impact Calculator) (Williams et al., 1989) 모델을 기반으로 USDA와 Texas A&M AgriLife Research에서 개발한 모델로서, 다중 필지 및 소유역 규모까지 확장하여 평가할 수 있다. 또한, 수질뿐만 아니라 농업 생산성, 비료·분뇨, 관리 방식을 고려하여 분석 가능하다(Kamruzzaman et al., 2020).

2.3. 토양탄소 및 온실가스 모델

Daycent 모델은 미국 Colorado State University에서 CENTURY 모델의 일일 단위 버전으로 개발하였다. Daycent는 토양 유기탄소와 질소 동태, 온실가스(N₂O, CO₂, CH₄) 배출을 동시에 모의할 수 있고, 무경운 (no-till), 윤작 등 농업 관리 시나리오별 효과를 정량적으로 비교할 수 있어 국가 단위 온실가스 배출량 추정 및 정량화에 활용되었다(Del Grosso et al., 2005; Stehfest et al., 2007).

DNDC 모델은 미국 University of New Hampshire에서 개발되었으며, 토양의 탈질 및 분해 과정을 기반으로 비료 관리, 토양 유형, 기후 조건에 따른 온실가스 배출 변화를 정밀하게 모의할 수 있다는 강점을 가진다(Abdalla et al., 2011; Ludwig et al., 2011).

2.4. 전국단위 평가 시 과정기반모델의 한계

PBM을 국가 단위의 기후변화 영향·취약성 평가에 적용할 경우 몇 가지 제약이 있다. 첫째, 데이터 수집 및 매개변수 최적화의 어려움이다. 과정 기반 모델은 모델 구동을 위해 토양 물리·화학적 특성, 기상자료, 토지이용 등 장기간의 관측 자료가 필요하며 수많은 매개변수를 최적화하기 위해 작물 생육, 수문·수질, 온실가스 등 모델의 목적에 맞는 관측자료가 필요하다. 이러한 자료가 불충분할 경우 모의 결과의 불확실성이 크게 증가한다. 둘째, 불확실성과 전이성(transferability)의 제약이다. 모델은 특정 지역·조건에서 개발 및 보·검정 되었기 때문에 다른 지역 또는 관리 시나리오에 적용할 때 예측력이 떨어질 수 있다. 셋째, 연산 비용에 따른 부담이다. 특히 다수의 기후 시나리오, 토양 조건, 관리 방안 등을 고려한 앙상블 분석에서는 막대한 연산 자원과 시간이 요구되어 국가단위에서 기후변화 대응을 위한 빠른 의사결정 지원에 제약이 따른다.

첫 번째와 두 번째 제약의 경우는 관측자료의 수집·공유 체계의 구축과 다양한 매개변수 보정 기술 개발을 통해 점차 개선할 수 있을 것으로 기대한다. 다만 그 속도는 상당히 느리고 모델이 가진 불확실성이 지금 수준보다 크게 개선될 것으로 기대하기 어렵다. 따라서 상기 한계는 경량·고속 예측 수단의 도입 필요성을 시사하며, 그 대안으로 대리모델(surrogate model) 활용이 주목된다.

3. 대리모델의 분류 및 특성

3.1. 대리모델의 분류

대리모델(surrogate model)은 입력 변수와 출력 결과 사이의 복잡한 관계를 통계적 또는 기계학습 방법으로 근사하여 다양한 예측·분석 작업을 효율적으로 수행하도록 설계된 모델이다(Eldred et al., 2002). 국가 단위의 대규모 기후변화 영향·취약성 평가에서는 고해상도 시·공간 격자 운용과 기후 시나리오별 GCM (General Circulation Model) 앙상블에 따른 연산 부담이 급증하고, 고차원·비선형 입력공간에서의 전역 민감도 분석과 불확실성 전파 평가에도 상당한 시간·비용이 요구된다. 대리모델은 이러한 문제를 저비용·고속의 근사 연산으로 해소할 수 있다. 즉, 대리모델을 연계하면 수백 ~ 수천 회 규모의 시나리오 조합에 대한 평가, 전역 민감도 분석, 불확실성 정량화, 대응 정책 간의 비교·다목적 최적화를 제한된 연산 시간과 자원 내에서 수행할 수 있으며, 신규 관측 정보 유입 시 신속한 재학습을 통해 정보 갱신과 실시간 의사결정 지원이 가능해져 정책적 활용도가 높을 것으로 기대한다.

대리모델은 우선 사용하는 자료의 종류에 따라 분류되는데, 관측, 조사, 원격탐사 등 실측 기반의 대규모 자료를 학습하는 방식인 데이터 기반 대리모델(Data driven surrogate model), 과정 기반 모델(Process based model)에서 생성된 입출력 자료를 활용하는 방식인 메타모델(Meta-model)로 분류된다. 또한, 관측자료와 과정 기반 모델의 산출을 결합하는 하이브리드 모델(Hybrid model), 서로 다른 충실도(저·고 등)의 모의를 계층적으로 통합하는 다중충실도 모델(Multi-fidelity model)이 있다(Fig. 1).

Fig. 1.

Taxonomy of surrogate models by data source, learning paradigm, and output type

(i) 데이터 기반 대리모델은 실제 측정된 데이터의 학습을 통해 구축되므로 현장 적합성과 재현력이 뛰어나며, 특히 기존 관측 범위 내에서 높은 예측 정확도를 보인다. 그러나 학습에 사용된 데이터 분포를 벗어나는 새로운 기후 조건이나 경작 관리 방식 등에는 예측 신뢰도가 급격히 저하되며, 정책 시나리오처럼 실제로 관측이 불가능한 조합에 대해서는 본질적인 한계를 가진다(Zhang et al., 2024).
(ii) 메타모델은 과정 기반 모델로부터 실험설계(Design of Experiments, DoE)에 따라 생성된 입력~출력 데이터를 바탕으로 학습된 근사 모델이다. 이러한 메타모델은 관측이 어려운 미래 시나리오까지 예측 가능하다는 점에서 강점을 가지며, 특히 관측자료가 희소한 경우에도 폭넓은 적용이 가능하다. 그러나 과정 기반 모델이 현실을 부정확하게 반영하는 경우, 그 구조적 오류(structural error)가 메타모델에 그대로 전달될 수 있으며, 실험설계가 부적절하게 구성되면 예측 신뢰도가 낮아지고 외삽(extrapolation) 영역에서의 위험성이 커질 수 있다(Backlund et al., 2010).
(iii) 하이브리드/다중충실도 모델은 관측 데이터와 과정 기반 모델들을 결합하여 장점을 통합한다. 하이브리드 모델은 과정 기반 모델 내부의 특정 모듈을 관측 데이터를 활용한 기계학습으로 대체하거나 모의 결과와 관측값 간의 반복적 오차 패턴을 학습하여 예측값을 보정 하는 것을 의미한다. 다중충실도 모델은 경험식(empirical model)과 같은 저충실도 모델로 전역 패턴을, 과정 기반 모델과 같은 소수의 고충실도 모델로 스케일·편향을 보정한다. 단, 데이터 정합(해상도·단위·좌표)과 음의 전이(낮은 품질의 정보가 성능을 해치는 현상)에 각별히 유의해야 한다(Li et al., 2025). 또한 하이브리드 또는 다중충실도 모델은 다양한 데이터 출처(관측·실험·모의)를 결합해 실제 환경의 복잡한 상호작용을 세밀하게 재현할 수 있으나 모델 구성의 복잡성과 대규모 데이터 정합·관리 비용이 매우 크기 때문에 국가 단위 평가와 같이 수천~수만 개의 시나리오를 신속히 탐색해야 하는 의사결정 지원 환경에서는 현실적인 한계가 존재한다.

학습 패러다임은 확률적 가정과 추론을 중심으로 하는 통계적 접근(statistical approach)방식과 예측력을 최우선으로 두는 기계학습(ML, Machine Learning) 접근방식으로 나눌 수 있다(Fig. 1). 통계적 접근은 자료의 발생 메커니즘을 확률적으로 가정하고, 제한된 표본으로부터 모집단의 특성을 추론하는 데 초점을 둔다. 이 접근법은 변수 간의 인과관계나 구조적 의존성을 명시적으로 모델링하기 때문에, 분석결과를 해석하고 설명하는 데 강점을 지닌다. 반면 기계학습 및 인공지능 접근방식은 통계적 가정의 엄밀함보다는 예측의 정확도와 일반화 능력을 극대화하는 것에 초점을 두며, 데이터의 잠재적 패턴과 비선형 관계를 대규모 학습을 통해 경험적으로 학습한다. 이 접근방식들은 데이터가 따르는 분포나 구조를 미리 설정하지 않고 가능한 많은 데이터를 이용해 관측값과 예측값의 차이를 줄이는 방향으로 모델이 스스로 규칙을 찾아가며, 이를 통해 복잡하고 비선형적인 관계를 효과적으로 표현할 수 있다.

출력의 형태에 따라서는 단 하나의 대푯값만 주는 점 추정형(point predictor)과 예측의 불확실성까지 함께 주는 분포 추정형(probabilistic predictor)으로 나뉜다(Fig. 1). 점 추정형은 단 하나의 대표값(평균, 중앙값 등)을 산출하여 명확한 예측값을 제공한다는 점에서 단순하고 직관적이지만, 예측값이 가진 불확실성을 함께 제시하지 못한다는 한계를 가진다. 반면 분포 추정형은 출력이 단일값이 아니라 확률분포의 형태로 주어지며, 이를 통해 예측의 신뢰구간(confidence interval), 예측오차(prediction error), 혹은 리스크의 범위까지 동시에 고려할 수 있다. 이러한 접근은 기후변화 영향·취약성 평가 분야와 같이 입력 변수의 변동성이 크고, 관측오차나 모델 불확실성이 존재하는 영역에서 특히 중요하다.

3.2. 대리모델 유형별 대표 구현기법 및 특성

통계적 접근방식의 대리모델 구현기법은 상대적으로 단순한 수학적 구조와 명확한 해석 가능성을 갖는 기법으로 스플라인(Splines), 일반화 선형 모델(Generalized Linear Model, GLM), 반응표면분석법(Response Surface Methodology, RSM) 등이 대표적이다. 이들은 모델 구조가 명시적이며 계수의 통계적 유의성을 평가할 수 있어, 변수 간 관계를 정량적으로 설명해야 하는 상황에 적합하다. 또한 가우시안 프로세스(GP, Kriging)와 같은 확률적 기법은 예측값 자체와 함께 분산 또는 신뢰구간을 동시에 산출함으로써 불확실성 정보를 제공할 수 있다는 점에서 분포 추정형 기법으로 분류된다(Table 1).

Table 1.

Representative surrogate modeling approaches classified by learning paradigm and output type

한편 기계학습 접근방식의 대리모델 구현기법은 전통적인 기계학습(Conventional ML)과 딥러닝(Deep learning)으로 구분할 수 있으며 전통적인 기계학습에는 여러 약한 모델을 결합하여 강력한 예측 성능을 달성하는 랜덤포레스트(Random Forest, RF), 그래디언트 부스팅(Gradient boosting) 등이 있으며, 딥러닝에는 비선형성, 시간적 의존성, 공간적 패턴 인식 등에 뛰어난 신경망 계열(Neural Networks)의 모델들이 있다. 예측값과 불확실성을 동시에 제시하는 확률형 기법에는 분위수 회귀포레스트(Quantile Regression Forests, QRF), 분위수 그래디언트 부스팅(Quantile Gradient Boosting, QGB), 베이지안 신경망(Bayesian Neural Networks, BNN) 모델이 있으며, 이 기법들은 점 예측의 정확도와 더불어 결과의 신뢰도까지 정량화할 수 있다(Table 1).

통계적인 접근기법에 관하여, RSM (Response Surface Methodology)은 저차원 다항식을 이용하여 시뮬레이터 출력의 반응면을 근사하는 통계적 대리모델이다. 전형적인 2차 반응표면은 다음과 같이 정의된다(Box and Wilson, 1992).

m x = β 0 + ∑ k = 1 p β k x k + ∑ k = 1 p β k k x k 2 + ∑ 1 ≤ j < k ≤ p β j k x j x k

(1)

여기서, $x = x 1, x 2, …, x p$ 는 p차원 입력벡터, β₀는 절편, β_k는 일차 효과, β_kk는 곡률 계수, β_jk는 상호작용 계수이다. 계수 β는 최소제곱법을 통해 추정된다. 이 방법은 입력–출력 관계의 전역적 추세를 단순 구조로 설명할 수 있다는 장점이 있다.

GP (Gaussian Process, Kriging)는 함수 전체를 확률과정으로 두어 평균과 분산을 동시에 추정하는 분포추정 방법이다(Rasmussen, 2003). f를 GP로 두면

f ∼ G P m 0 ⋅, k θ ⋅, ⋅, ϵ ∼ N 0, σ 2

(2)

여기서, $m 0 ⋅$ 는 사전 평균 함수, $k t h e a t ⋅, ⋅$ 는 커널 함수, σ²은 관측 잡음 분산이다. 커널 함수의 선택에 따라 함수의 매끄러움, 주기성, 변동성에 대한 가정이 달라지며 대표적으로 RBF (Radial Basis Function)가 쓰인다. RBF는 다음과 같다.

k x, x ′ = σ f 2 exp - x - x ′ 2 2 l 2

(3)

여기서 $σ f 2$ 는 함수 출력의 분산 크기이며 $l$ 은 길이 척도(length scale)로서 입력 값의 변화에 따른 출력값의 변화를 조절하는 매개변수이다.

기계학습 접근 기법에 관하여 RF는 부트스트랩 표본과 무작위 특성 선택을 이용하여 다수의 회귀트리를 학습하고, 그 결과를 평균하여 예측하는 비모수적 점추정 대리모델이다(Breiman, 2001). 예측값 $m^R F x$ 를 산정하는 식은 다음과 같이 정의된다.

m^R F x = 1 T ∑ t = 1 T h t x

(4)

여기서, T는 트리 개수, h_t(x)는 t번째 트리의 예측값이다. 각 트리는 입력공간을 분할하여 지역적 평균을 반환하며, 트리의 평균은 분산을 줄이고 안정적인 예측 성능을 보인다.

XGBoost는 gradient boosting 기법의 확장된 구현으로, 회귀트리(regression tree)를 약한 학습기로 사용한다(Chen and Guestrin, 2016; Friedman, 2001). 회귀트리는 입력 공간을 여러 구간(region)으로 분할한 뒤, 각 구간에 속한 데이터의 평균값을 출력으로 반환하는 모델이다. 이때 입력 공간을 분할하는 과정에서 만들어지는 최종 구간을 단말 노드(terminal node) 또는 잎(leaf)이라고 부르며, 각 잎에는 해당 구간에 속하는 데이터가 연결된다. Gradient boosting은 반복 단계 $m = 1,2, …, M$ 마다 새로운 회귀트리 b_m(x)를 추가하여 이전 모델 F_m_-1(x)의 예측을 보정한다. 최종 모델은 다음과 같이 표현된다.

F M x = ∑ m = 1 M η b m x

(5)

여기서 $η ∈ 0,1$ 는 학습률(learning rate)이다. 각 단계에서 추가되는 트리(b_m)은 손실함수 L(y_i, F(x_i))를 줄이는 방향으로 학습된다. 여기서 L(·)은 예측값과 관측값의 차이를 측정하는 함수로, 제곱오차 $L y, y^= y - y^2$ 등이 될 수 있다(Friedman, 2001). XGBoost는 2차 도함수를 활용한 안정적인 가중치 계산, 정규화 항을 통한 과적합 억제, 희소 입력 및 대규모 데이터에 적합한 최적화 기법을 제공한다는 점에서 우수한 성능을 보인다(Chen and Guestrin, 2016).

신경망(Neural Network, NN)은 입력–출력 관계를 비선형 함수의 조합으로 근사하는 대표적인 기계학습 모델로, 다층 퍼셉트론(Artificial Neural Network, ANN), 합성곱 신경망(Convolutional Neural Network, CNN), 순환 신경망(Recurrent Neural Network, RNN) 등 다양한 구조가 존재한다. NN 계열 모델은 은닉층(hidden layer)과 비선형 활성함수(non-linear activation)를 활용해 복잡한 고차원의 입력 특징을 추출하고 학습할 수 있으며, 구조와 연결 방식에 따라 공간적 패턴(CNN)이나 시계열·순차적 상관성(RNN)을 모델링할 수 있다는 점이 특징이다. 신경망 모델의 일반적인 예측 함수는 다음과 같이 표현된다(LeCun et al., 2015).

y^= f x; θ = W L σ W L - 1 σ ⋯ σ W 1 x + b 1 + b L - 1 + b L

(6)

여기서 $x ∈ R d$ 는 입력 벡터, θ는 모든 계층의 가중치와 편향을 포함한 모델 매개변수 전체집합, 즉, $θ = W l, b l l = 1 L$ , $y^$ 는 예측값, W^(l)와 b^(l)는 l번째 층의 가중치와 편향, σ(·)는 비선형 활성함수다.

기계학습 접근 기법에 관하여 QRF (Quantile Regression Forest)는 RF의 확장으로, 조건부 평균 예측 대신 조건부 분포 전체를 추정할 수 있도록 고안되었다(Meinshausen, 2006). RF는 입력 х에서 출력 Y의 불확실성을 반영할 수 없는 한계가 있으나 QRF는 주어진 입력 х에 대해 학습데이터의 조건부 분포를 경험적으로 추정하여 불확실성을 반영한다.

새로운 입력 х가 주어지면, QRF는 숲의 각 트리에서 х가 도달하는 단말노드(잎)를 확인하고, 해당 노드에 속한 학습 표본들을 х와 유사한 데이터로 간주한다. 표본 i의 응답값 y_i가 х와 얼마나 유사한지 나타내는 가중치 w_i(x)는 다음과 같다.

w i x = 1 T ∑ t = 1 T 1 x ∈ R t l i 1 x i ∈ R t l i R t l i

(7)

여기서 T는 트리의 총 개수, $R t l i$ 는 트리 t에서 학습 표본 i가 속한 단말 노드 번호 $l i$ 의 단말 노드, $R t l i$ 는 그 단말 노드에 포함된 데이터의 개수, 1{·}는 지시함수(Indicator function)이다(Meinshausen, 2006).

QRF는 RF의 비모수적 특성과 앙상블 기반 안정성을 계승하면서, 데이터 기반의 경험분포를 직접 산출한다는 점에서 계산 효율성과 예측 불확실성 추정을 동시에 달성할 수 있어 취약성 평가 시 하위 수확량, 극한 홍수 등 리스크 지표 산출에 유용하다. 한편, 데이터가 희소한 구간에서는 과대 또는 과소 추정될 수 있으며 트리 기반 모델의 특성상 외삽 능력이 제한된다는 점을 고려해야 한다(Meinshausen, 2006).

Bayesian Neural Network (BNN)은 신경망의 가중치와 편향을 고정된 점 추정치로 학습하는 대신 확률변수로 취급하여 사후분포(posterior distribution)를 추정하는 확률론적 모델이다(Neal, 1995). BNN의 목표는 학습 데이터 세트 D에 대하여 모델 매개변수 θ의 사후분포 p(θ|D)를 근사하고, 새로운 입력 x^*에서 출력의 조건부 분포를 추론하는 것이다. 이때 예측분포는 다음과 같다.

p y * x *, D = ∫ p y * x *, θ p θ D d θ

(8)

BNN은 딥러닝의 표현력을 유지하면서도 모델 불확실성(모델 매개변수 추정의 불확실성, epistemic uncertainty)을 명시적으로 추정할 수 있어 기후·환경 모델링과 같이 데이터가 제한적이거나 외삽 상황이 발생하는 문제에서 유용하다. 다만, 모델 학습 시 파라미터 공간의 사후분포를 근사해야 하므로 계산량이 크고 학습 시간이 길다는 단점이 있다. 따라서 실무에서는 몬테카를로 드롭아웃(Monte Carlo Dropout)이나 앙상블 기반 추정(Deep Ensemble)과 같이 효율성을 높인 근사 기법이 널리 활용된다(Gal and Ghahramani, 2016; Lakshminarayanan et al., 2017).

3.3. 대리모델 구현기법의 비교

대리모델 구현기법의 비교를 위한 학습 자료는 다음과 같은 방식으로 생성하였다. 먼저 입력 x는 구간별로 상이한 밀도를 갖도록 의도적으로 배치하였다. 좌측 구간 [−4.2, −1.6]에서 다수의 표본을 균등분포로 추출하고, 우측 구간 [2.6, 4.2]에서는 상대적으로 적은 수의 표본을, 그리고 중앙 구간 [−1.6, 2.6]에는 소수의 표본(7개)만을 배치하였다. 종속 변수 y는 기준함수(reference function) f(x) = sin (1.2x) + 0.25x를 기반으로 최소 표준편차가 0.12인 이분산성(heteroscedasticity) 잡음을 추가하여 생성하였다.

Fig. 2는 통계적 접근방식으로 구현된 대리모델 중 점 추정형과 분포 추정형의 예측 특성을 보여준다. 점 추정형은 RSM의 일반적인 형태인 다항함수를, 분포 추정형은 GP를 이용하였다. 그림에서 초록색 점선은 기준함수를, 파란색 곡선은 3차 다항회귀(cubic polynomial regression)를 통해 얻은 점 추정의 예측 결과를 나타낸다. 이 방법은 입력에 대해 단일한 추정치만을 반환하며, 불확실성 정보를 제공하지 않는다. 반면 주황색 곡선은 GP 기반 분포추정의 조건부 평균을 나타내며, 주변의 음영 영역은 예측 분포의 95% 신뢰구간을 제시한다. Fig. 2를 살펴보면, 중앙부처럼 데이터가 희소한 영역에서는 GP 신뢰구간이 넓어져 불확실성이 커짐을 나타냈고, 데이터가 충분한 구간에서는 좁은 분포로 수렴한다. 이는 분포추정이 자료가 부족한 구간에서는 예측 불확실성이 증가한다는 사실을 신뢰구간의 확대로 자연스럽게 드러낸다는 점을 잘 보여준다.

Fig. 2.

Comparison between a cubic polynomial point predictor and a Gaussian process (GP) emulator on the same synthetic data y=fx+ϵfx=sin ⁡1.2x+0.25x.. While the polynomial returns a single m^x, the GP provides μ(x) with a 95% predictive band μ±1.96s, which expands in sparse regions

Fig. 3은 Fig. 2와 동일한 학습 자료를 이용하여, 기계학습 및 인공신경망 접근방식으로 구현된 대리모델 중 점 추정형 간의 예측 특성을 비교한 것이다. 기계학습 기반 기법은 RF를, 딥러닝 기반 기법은 RNN을 이용하였다. 주황색 계단형 곡선은 RF를 이용한 예측 결과로, RF는 개별 회귀트리가 입력공간을 국소적으로 분할하여 각 구간에서 평균 응답을 반환하는 방식으로 학습된다. 이러한 구조는 데이터의 비선형성과 국지적 변동성을 효과적으로 포착할 수 있다는 장점이 있으나, 예측 곡선이 매끄럽지 않고 분할 경계에서 불연속적으로 변하는 한계가 있다. XGboost는 RF보다 더 세밀하게 데이터의 패턴을 학습할 수 있으나, 여전히 트리 기반 모델의 특성상 구간별 계단형 예측이 나타난다.

Fig. 3.

Comparison of machine learning–based point predictors. The Random Forest (RF, orange) produces stepwise predictions characteristic of tree ensembles. XGBoost (purple) also uses boosted trees, yielding more adaptive estimates while retaining some stepwise behavior. The Recurrent Neural Network (RNN, blue) provides smoother predictions through parameter sharing and sequential modeling

한편, Fig. 3에서 RNN은 순환 구조와 파라미터 공유를 통해 입력값 간 연속성과 순차적 상관관계를 학습함으로써 매끄러운 예측 곡선을 제공한다. 특히 RNN은 시간적·순차적 특성을 반영하도록 설계되어 1차원 연속 입력에서도 데이터 간 연결성을 자연스럽게 모델링 할 수 있으며, 결과적으로 RF보다 곡선이 부드럽고 전체 함수의 연속적인 패턴을 잘 추종한다.

RF와 RNN은 단순 다항회귀보다 데이터의 패턴을 충실히 반영하기 때문에 복잡한 비선형 관계나 시계열 구조를 보다 효과적으로 모델링 할 수 있다. 그러나 예측값이 단일점 추정치에 한정되며, 불확실성 정보가 제공되지 않는다는 점에서 위험도 평가나 신뢰구간 기반 의사결정에는 부적합할 것으로 판단된다.

Fig. 4는 Fig. 2 및 Fig. 3과 동일한 학습 자료를 이용하여, 인공지능 접근방식으로 구현된 대리모델 중 분포 추정형의 예측 특성을 비교한 것이다. 기계학습 기반 기법은 QRF를, 딥러닝 기반 기법은 BNN을 이용하였다. 주황색 곡선은 QRF로 부터 얻은 조건부 분포의 중앙값을 나타내며, 주황색 음영 구간은 하위 10% 분위수와 상위 90% 분위수 사이의 범위를 의미한다. 이 예측 대역은 전체 예측분포의 약 80% 신뢰수준에 해당하는 것으로 해석할 수 있으며, 모델이 추정하는 예측 불확실성을 직관적으로 시각화한 것이다. QRF는 학습데이터가 충분한 구간에서는 상대적으로 좁은 예측 대역을 형성하여 안정적인 추정을 제공하지만, 데이터가 희소하거나 반응 함수의 곡률이 급격히 변화하는 구간에서는 대역이 넓어지며 불확실성이 커지는 경향을 보인다. 이는 단순한 점 추정만 제공하는 다항회귀나 RF와 달리 QRF가 조건부 경험분포를 통해 예측값뿐만 아니라 그 값이 가질 수 있는 범위까지 제공할 수 있음을 보여준다.

Fig. 4.

Comparison of probabilistic predictors: Quantile Random Forest (QRF, orange) and Bayesian Neural Network (BNN, blue) trained on the same dataset with a central gap. Both models provide predictive distributions, visualized by the shaded 10 ~ 90% predictive intervals. QRF represents uncertainty using empirical distributions of tree leaf nodes, resulting in a piecewise-constant predictive median, while BNN leverages posterior weight sampling to produce a smoother predictive mean and credible intervals

한편, 파란색 곡선으로 나타낸 BNN 예측은 신경망 가중치에 대한 베이지안 사후분포 추정을 통해 산출된 예측 평균이며, 파란색 음영은 사후표본 샘플링(Markov chain dropout)으로 추정된 10 ~ 90% 신뢰구간을 의미한다. BNN은 분포 추정 시 모델 구조의 유연성과 파라미터 공간의 확률적 탐색을 결합함으로써, 훈련 데이터가 드문 영역에서도 비교적 부드럽고 연속적인 불확실성 곡선을 제시한다. 다만, QRF가 트리 기반의 비모수적 접근을 통해 빠르고 직관적인 불확실성 추정을 제공하는 반면, BNN은 학습 단계에서 계산 비용이 높고 하이퍼파라미터 선택에 민감하다는 점이 단점으로 지적된다(Gal and Ghahramani, 2016; Meinshausen, 2006). 그럼에도 두 기법 모두 점 추정에 국한된 회귀모델 대비 예측 분포와 불확실성을 직접적으로 정량화할 수 있어, 기후변화 영향·취약성 평가나 리스크 기반 의사결정과 같이 신뢰구간을 활용한 정량적 판단이 필요한 경우에 적합할 것으로 판단된다.

한편, Fig. 2, Fig. 3, Fig. 4에서 모든 대리모델 구현기법의 예측은 학습 자료의 범위인 [-4.2, 4.2]를 벗어날 경우 기준함수의 경향과 다르게 수렴하는 양상을 보인다. 이는 대리모델이 데이터 분포에 기반한 내삽에는 우수하지만, 관측되지 않은 영역에 대한 외삽에서는 구조적으로 불안정하다는 점을 의미한다. 이러한 특성은 데이터 기반 대리모델이 본질적으로 관측된 범위 내에서만 일반화가 가능하다는 한계를 보여주며, 따라서 기후변화 영향평가와 같이 미래의 기후 조건이나 대응 시나리오를 예측해야 하는 상황에서는 예측 신뢰도가 현저히 저하될 수 있음을 시사한다.

4. 국가 및 광역 단위 평가를 위한 대리모델 활용 사례

4.1. 농업 생산성 평가 분야

Table 2는 국가 및 광역 단위에서 수행된 농업 생산성 평가 관련 대리모델 적용 사례를 요약한 것이다. 각 연구는 PBM을 기반으로 머신러닝 또는 통계적 기법을 활용하여 공간적 확장성, 계산 효율성, 그리고 예측 정확성을 향상시킨 대표적인 사례로 선정하였다.

Table 2.

Representative applications of surrogate (meta, hybrid) modeling for national- and regional-scale agricultural productivity assessment

Johnston et al. (2023)은 APSIM-NextGen 병아리콩 모델을 활용하여 파종 후 발아일수, 출수일수, 성숙일수, 지상부 생체량, 수확곡량 등 여섯 가지 주요 출력 변수를 대상으로 인공신경망(ANN), 다변량 적응 회귀 스플라인(MARS), 랜덤 포레스트(RF) 세 가지 머신러닝 알고리즘 기반 대리(메타)모델을 개발하였다. 그 결과, 훈련 영역에서 R² > 0.95의 높은 적합도를 보였으며, ANN 기반 모델은 약 200배, MARS는 500배 빠른 계산속도를 보여 대규모 민감도·시나리오 분석을 가능하게 하였다. 그러나 훈련 자료에 포함되지 않은 지역에서는 성능이 저하되는 한계를 드러냈다(Johnston et al., 2023).

Shahhosseini et al. (2021)은 미국 콘벨트 13개 주의 옥수수 생산량을 대상으로 APSIM에서 모의된 질소·수분 스트레스 변수와 기상·토양 정보를 결합하여 LASSO (Least Absolute Shrinkage and Selection Operator), RF, XGBoost, LightGBM 등 앙상블 대리모델을 학습시켰다. 이렇게 구축된 대리(메타)모델은 관측 데이터만을 학습한 대리모델에 비해 R²가 0.25 ~ 0.30 p 높았고 RMSE (Root Mean Square Error)는 7 ~ 20% 낮았으며, 연산 속도는 APSIM 모델을 구동하는 것에 비해 수천 배가 향상되었다(Shahhosseini et al., 2021).

Zhao et al. (2023)은 중국 화북평원에서 APSIM의 생육단계별 누적생체량을 Random Forest로 학습하여 밀의 시기별 수량을 예측하였다. 개발된 대리모델은 개화기~유숙기 구간에서 r 0.86, RMSE 0.68 t/ha의 정확도를 확보하였으며, 수확 약 한 달 전에 생산량을 예측할 수 있기 때문에 수매 및 비축계획 등 정책결정에 활용가능한 정보를 제공할 수 있다고 하였다(Zhao et al., 2023).

한편, 대리(메타)모델을 활용한 공간 확장과 계산 효율성 도모를 넘어서 데이터와 PBM을 동시에 학습함으로써 성능을 개선한 하이브리드 모델의 사례는 다음과 같다. Li et al. (2024)은 중국 간쑤성의 장기 기상·토양·생산성 자료와 APSIM 모델의 메타모델을 가중 결합한 대리(하이브리드)모델을 제시하였다. 그 결과, APSIM 단독 대비 RMSE가 약 7.5% 감소하고, 메타모델 단독 대비 3.5% 개선되어 지역 단위 수량 평가의 정확도와 안정성이 향상되었다. 모델 결합에 따른 계산부하는 다소 증가하였으나, PBM 단독 반복 시뮬레이션보다 상당히 효율적인 것으로 평가되었다(Li et al., 2024).

Xie (2022)는 CERES-Wheat 모델의 시뮬레이션 결과와 Sentinel-2 영상으로부터 추출한 LAI (Leaf Area Index) 시계열을 결합하여, 지역 단위의 밀 수량을 예측하는 인공신경망 계열의 LSTM (Long Short-Term Memory) 대리(하이브리드)모델을 구축하였다. CERES-Wheat 모델로 35개 농업기상관측소의 LAI 및 지상부 생체량을 일별 모의하고 LSTM으로 사전학습(pre-training) 하였으며, 이후 Sentinel-2 LAI와 실측 생체량으로 재학습(re-training)하여 모델을 보정하였다. 그 결과, 재학습된 LSTM의 예측 정확도는 PBM-학습 LSTM (R² = 0.85, RMSE = 336 kg/ha) 및 위성영상 학습 LSTM (R² = 0.84, RMSE = 374 kg/ha)보다 높았으며, R² = 0.90, RMSE = 287 kg/ha을 기록하였다(Xie, 2022). 연산효율성 면에서는 정량 비교 수치는 제시되지 않았으나, CERES-Wheat를 활용한 모의를 전 지역에 수행하는 대신 LSTM 대리모델을 활용함으로써 전국·광역 단위 운영에 적합한 연산 경량화를 달성했다고 평가된다(Xie, 2022).

Kheir et al. (2023)은 APSIM NextGen을 이용하여 밀 생산량에 관한 입출력 자료를 구성하고 APSIM NextGen 모델에 포함되지 않는 외생변수인 생산기술의 발전, 지형 등을 포함하여 인공신경망을 학습시켰다. 구축된 대리(하이브리드)모델은 PBM의 연산 복잡도를 크게 줄이면서도 Willmott d 지수가 0.89에서 0.95로 향상되었고, 전국 수준의 시비·품종별 정책평가를 수시간 내 수행할 수 있게 되었다(Kheir et al., 2023).

4.2. 농업 수문･수질 평가 분야

농업 유역에서의 비점오염(nonpoint source pollution) 및 수문·수질 관리는 고해상도 공간자료와 다양한 수문·토지이용 변수를 필요로 하기 때문에, 대규모 시뮬레이션을 기반으로 한 시나리오 분석은 연산비용이 매우 높다. 이에 따라 최근 연구들은 PBM의 시뮬레이션 데이터를 학습한 메타모델을 활용하여 계산 효율성을 확보하고 최적 관리전략(BMP, Best Management Practice) 도출에 활용하고 있다(Table 3).

Table 3.

Representative applications of surrogate (meta) modeling for agricultural hydrology and water quality assessment

Zhang et al. (2009)은 미국 조지아주의 Little River Experimental Watershed (334 km²)와 펜실베이니아주의 Mahantango Creek Experimental Watershed (7 km²)를 대상으로 SWAT 모델의 16개 핵심 매개변수 변화에 따른 출력 반응을 평가하고, ANN과 SVM (Support Vector Machine) 기반 메타모델을 비교하였다. 실험 결과 SVM이 ANN보다 일반화 성능이 높았으며, 모수 차원 축소와 3-fold 교차검증을 통해 대리모델의 안정성을 확보함으로써, 불확실성 분석에 소요되는 계산 시간이 20 ~ 35% 절감되었다.

Azzellino et al. (2015)은 이탈리아 베네치아 석호 유역(1,952 km²)을 대상으로 SWAT 모델을 구축하여 8개 주요 소유역을 모의하고, 176개 소유역과 4,855 HRU 단위로 영양물질 부하를 ANN의 한 유형인 MLP (Multilayer Perceptron)로 학습시켰다. 연구 결과, 질소와 인 부하에 대한 모델 간 상대오차(RMAE, Relative Mean Absolute Error)는 각각 4%와 10%로 나타났으며, MLP 모델이 SWAT 결과를 약 90% 이상의 정확도로 재현한 것으로 평가되었다. 하위 유역별 예측 오차는 평균 20 ~ 40% 수준에 불과했으며, SWAT의 복잡한 물리적 계산 대신 대리모델을 이용함으로써 시나리오 분석 소요시간을 수 시간에서 수 초 수준으로 단축시켰다. 이러한 접근은 수질관리 대안의 공간적 비교를 실시간 수준으로 가능하게 하여, 대리모델이 정책 의사결정 과정에 직접 활용될 수 있음을 입증하였다.

Choi et al. (2024)은 대한민국의 논과 밭의 양분유출을 평가하기 위해 APEX 모델을 기반으로 학습한 비선형 회귀 모델을 개발했다. 시험포장 관측자료를 기반으로 보정한 APEX 모델로 학습데이터를 생성한 뒤, 이를 이용해 시·군 단위 양분유출 취약성을 산정했다. 그 결과, 대리(메타)모델의 R²는 논의 질소 유출에 관하여 0.53, 밭의 질소 유출 0.72, 밭의 인 유출 0.71로 평가되어 지역 간 변동을 안정적으로 설명하였으며, 웹 기반 시각화 시스템에서는 시나리오 선택 후 수 초 이내에 전국 단위 결과를 제공할 수 있었다. 이는 APEX 모델을 직접 구동으로는 수일 이상 소요되는 계산을 획기적으로 단축한 사례로서, 대리모델을 활용한 실시간 전국 단위 평가가 정책 의사결정에 활용될 수 있음을 시사한다.

4.3. 온실가스 배출량 평가 분야

농경지에서의 아산화질소(N₂O) 배출은 토양 물리화학적 특성, 기상 조건, 질소 관리, 작물 생육단계 등 다양한 요인이 복합적으로 작용하기 때문에 시·공간적 변동성이 매우 크다. 이로 인해 배출계수를 산정하기 위한 현장 기반 장기 모니터링은 많은 시간과 비용을 요구하며, 국가 및 대륙 단위 배출량 산정에는 근본적인 제약이 따른다. 이러한 한계를 극복하기 위해 PBM인 DNDC나 DayCent의 결과를 학습한 대리(메타)모델이 개발되었다.

Table 4.

Representative applications of surrogate (meta) modeling for greenhouse gas emission assessment

이러한 접근의 대표적인 사례로, Giltrap and Ausseil (2016)은 뉴질랜드 목초지에서의 N₂O 배출 인자 추정을 위해 DNDC 모델 기반의 회귀형 메타모델을 개발하였다. 약 10,000개의 난수 기반 시나리오를 이용하여 토양유기탄소, 점토함량, 배수상태, 시비수준 등의 핵심 입력 변수를 학습시킨 결과, R²는 약 0.69로, 회귀 기반 메타모델이 NZ-DNDC 결과를 양호하게 재현하였으며, 전국 단위로 일반화 가능한 계산 효율성을 확보하였다. 한편, Perlman et al. (2014)은 전 세계 주요 곡물지대(밀, 옥수수)를 대상으로 DNDC 모델을 다중회귀와 RF 기반 대리(메타)모델로 단순화하였다. 약 2,800개의 토양 유형과 다양한 기상·시비 조건을 반영한 결과, 교차검증 R² = 0.91(밀), 0.97(옥수수)로 높은 정확도를 확보하였으며, 전지구 N₂O 배출지도 작성을 45,000 배의 속도로 작성할 수 있을 만큼 계산 효율을 극대화하였다.

또한, Lugato et al. (2017)은 유럽연합 전역의 농경지 약 20,000지점을 대상으로 LUCAS (Land Use/Cover Area frame Survey) 토양조사 자료와 DayCent 모델을 결합하여 N₂O 배출을 점 단위로 시뮬레이션하고, 이를 기반으로 RF 대리(메타)모델을 구축하였다. 메타모델은 DayCent 모의결과를 R² = 0.893, RMSE = 0.27 ~ 0.59 kg N ha^-1 yr^-1 수준으로 재현하였다. 24코어 CPU 서버를 이용해 11,628 지점 총 581,400회 모의를 수행한 DayCent의 계산에는 약 11시간이 소요되었으나, Random Forest 모델을 활용할 경우 계산 시간을 획기적으로 단축할 수 있었다. 이를 통해 유럽 전역의 배출량 공간분포를 고해상도로 예측할 수 있었으며, CAP (Common Agricultural Policy) 모니터링 및 국가별 온실가스 감축전략 수립에 활용 가능한 기반을 마련하였다.

이후 Nguyen et al. (2019)은 미국 콜로라도 주의 농업지역(약 29만 ha)을 대상으로 DayCent 모델을 인공신경망(ANN)으로 학습하여 대리(메타)모델을 구축하였다. ANN은 DayCent 모의 변동성의 99 % 이상(R² > 0.99) 을 재현하면서도 계산속도를 6.2 × 10⁶배 향상시켜, 수일이 걸리던 다목적 최적화 과정을 수초 내 수행할 수 있었다. 이를 통해 농업지역 내 수익, 온실가스, 수질오염 등을 동시에 고려한 실시간 의사결정이 가능함을 보여주었다.

5. 고찰 및 결론

본 연구에서는 국가 단위의 농업 부문 기후변화 영향 및 취약성 평가를 고도화하기 위해, 과정기반모델(Process-Based Model, PBM)과 대리모델(Surrogate Model)을 연계한 새로운 평가 체계를 제시하였다. PBM은 작물생육, 수문·수질, 온실가스 배출 등 다양한 농업·환경 과정을 과학적으로 재현할 수 있으나, 복잡한 매개변수 구조와 높은 연산비용으로 인해 전국 규모의 다중 시나리오 분석에는 한계가 존재한다. 이에 본 연구는 대리모델의 분류, 구현 기법, 및 적용사례를 통합적으로 검토함으로써, PBM의 과학적 신뢰성과 대리모델의 연산 효율성을 결합한 국가단위 평가체계를 제안하고자 하였다.

농업 생산성 분야에서는 APSIM, DSSAT, CERES-Wheat 등과 같은 PBM을 기반으로 ANN, RF, MARS, LSTM 등의 기계학습 기법을 학습시켜 전국 단위 수량평가를 실시간 수준으로 확장한 연구들이 수행되었다(Johnston et al., 2023; Kheir et al., 2023). 이들 연구는 기존 모델 대비 수백 배 이상 빠른 연산 속도와 R² > 0.9의 높은 재현력을 보였으며, 일부는 정책 시나리오별 품종·비료 정책 효과를 수 시간 내 분석할 수 있음을 입증하였다. 수문·수질 분야에서는 SWAT과 APEX 기반의 대리(메타)모델링이 연산시간을 수 주에서 수 분으로 단축시키며, 유역 및 전국 단위 양분유출 취약성 평가에 실시간 적용 가능한 수준의 효율성을 확보하였다(Azzellino et al., 2015; Choi et al., 2024; Zhang et al., 2009). 온실가스 평가 분야에서는 DNDC 및 DayCent 모델을 기반으로 한 회귀, RF, ANN 대리(메타)모델이 국가 및 대륙 규모의 N₂O 배출량을 고정밀·고효율로 산정할 수 있음을 보여주었다(Giltrap and Ausseil, 2016; Lugato et al., 2017; Nguyen et al., 2019). 이들 모델은 원본 PBM 대비 최대 10⁶배의 속도 향상을 달성하면서도, 전지구 1 km² 해상도 수준의 배출량 지도를 수일 이내 작성할 수 있었다.

이에 본 연구는 국가 단위의 기후변화 영향 및 취약성 평가를 수행하기 위한 절차로서 Fig. 5와 같은 대리모델 활용을 제안한다. 먼저 현장 관측 설계와 관측자료 수집을 통해 PBM 보정 및 검정이 수행된다. 검정 결과가 만족스럽지 않거나 향후 메타모델 구축 시 외삽 문제, 불확실성 문제가 발생할 우려가 있다면 더 넓은 범위에서 관측자료를 수집하고 모델을 재보정한다. 이후 검정된 PBM의 입·출력에 관한 실험설계를 통해 다양한 입력 조건과 시나리오가 생성되는데, 이때 기후자료의 경우는 기후변화 시나리오를 포함하여 향후 외삽에 따른 불확실성이 발생하지 않도록 한다. 입·출력 데이터 세트가 생성되면 요인별 민감도 분석 및 차원 축소 과정을 거쳐 주요 결정 요인을 선별한다. 이로부터 생성된 입력–출력 자료는 대리모델 학습에 활용되며, 일관성(consistency) 및 불확실성(uncertainty)에 대한 검증 절차를 통과한 경우, 국가 단위의 기후변화 영향평가와 취약성 평가에 적용될 수 있다. 만약 대리모델이 PBM을 충분히 모사하지 못한다면 다시 입·출력에 관한 실험설계로 돌아간다. 국가단위의 기후변화 영향평가에는 격자형 기후변화 시나리오와 공간 정보 데이터베이스가 활용되며, 각 지표별 평가 결과는 통합 취약성 평가를 위해 정규화하고(normalized) 가중치를 부여한다. 최종적으로 국가 단위의 기후변화 취약성 평가를 수행한다.

Fig. 5.

Framework for national-scale climate change vulnerability assessment using meta-modeling

이러한 접근의 핵심적인 장점은 PBM의 높은 계산 비용을 대리모델이 효과적으로 대체할 수 있다는 점이다. 특히 수십 개의 기후변화 시나리오 앙상블, 장기간(수십 년 단위)의 시뮬레이션, 수십만 개 이상의 격자 단위 평가와 같이 계산량이 폭증하는 상황에서, 대리모델은 빠른 근사 예측치를 제공함으로써 국가 단위 평가를 효율적으로 수행할 수 있도록 한다.

그러나 본 접근법에는 몇 가지 주의 사항이 존재한다. 첫째, 대리모델은 본질적으로 학습 자료의 범위 내에서만 신뢰성 있는 예측을 제공하므로, 학습되지 않은 영역(즉, 외삽 영역)에 대해서는 정확성이 크게 저하될 수 있다. 이러한 한계는 과정기반모델을 활용해 사전에 가능한 넓은 입력 범위에서 학습 데이터를 생성함으로써 완화할 수 있다. 즉, 평가 범위를 정책적으로 중요하거나 물리적으로 가능성이 있는 한계까지 확장하여 데이터베이스를 구축하면, 외삽 문제를 최소화할 수 있다.

둘째, 대리모델만으로는 기후변화 적응(adaptation) 기술이나 정책의 효과를 직접적으로 반영하기 어렵다는 문제가 있다. 이는 적응 기술을 과정기반모델에 구현한 상태에서 적응 적용 시나리오를 포함한 학습 자료를 생성하고, 이를 바탕으로 적응 후 대리모델을 별도로 학습하는 방식으로 보완할 수 있다. 결과적으로 적응 전과 적응 후를 각각 근사하는 대리모델을 구축함으로써, 정책 의사결정 과정에서 적응기술의 효과를 대리모델을 통해 신속하게 평가할 수 있다. 이는 정책 수립 및 실행 단계에서 반복적이고 다양한 시나리오 분석을 가능하게 한다는 점에서 유용하다.

셋째, 대리모델은 불확실성의 정량화가 부족할 수 있다. 단순한 점 추정 기반의 대리모델만으로는 위험 지표(예: 하위 10% 수확량, 초과확률 기반의 홍수 발생 가능성)를 추정하기 어렵다. 이 경우 GP나 QRF, BNN과 같은 분포 추정이 가능한 분포추정형 대리모델(에뮬레이터) 계열을 활용하면 불확실성 정보를 동시에 제공할 수 있다.

마지막으로, 대리모델은 PBM과 달리 물리적 과정의 설명력을 직접적으로 제공하지 않는다. 이는 PBM을 통해 선행적으로 민감도 분석을 실시하고, 주요 결정 요인을 규명한 뒤 이를 대리모델 설계에 반영함으로써 보완할 수 있다. 즉, 물리적 해석력은 PBM에서, 계산 효율성과 시나리오 확장성은 대리모델에서 분담하는 이원화된 접근을 통해 두 방법론의 장점을 동시에 활용할 수 있다.

본 연구는 국가 단위의 농업 부문 기후변화 영향 및 취약성 평가를 고도화하기 위해, PBM의 과학적 근거와 대리모델의 계산 효율성을 결합한 새로운 평가 프레임워크를 제시하였다. 제안된 체계는 기존의 PBM 단독 접근이 가진 연산 한계를 극복하면서도, 과학적 근거에 기반한 신뢰성 높은 평가를 수행할 수 있다는 점에서 학문적·정책적 의의를 가진다.

대리모델 기반 평가 체계는 PBM의 입·출력 자료를 기반으로 대리모델을 학습시켜, 국가 단위의 농업 생산성·수문·온실가스 평가를 수일 내에 수행할 수 있을 만큼의 효율성을 확보할 수 있을 것으로 판단된다. 이는 다수의 기후변화 시나리오와 적응 전략을 동시에 분석할 수 있는 기반을 마련함으로써, 향후 농업 부문 기후변화 대응정책 수립 과정에서 실질적인 의사결정 지원 도구로 활용될 수 있을 것으로 기대된다.

한편, 대리모델은 PBM의 출력값을 통계적으로 근사하기 때문에 학습 데이터의 범위를 벗어난 외삽(extrapolation) 영역에서 예측 신뢰도가 저하될 수 있으며, 기계학습 기반 접근의 물리적 해석력(interpretability) 부족 또한 주요 한계로 지적된다. 따라서 대리모델은 PBM을 완전히 대체하기보다는, 시나리오 탐색·의사결정 지원·불확실성 정량화 등 특정 목적에 한정해 활용되어야 한다. 이러한 한계를 극복하기 위해서는 주기적인 PBM 고도화와 관측자료 기반 검정이 병행되어야 하며, PBM에 포함되지 않은 외생 요인을 함께 학습시키는 하이브리드 모델 개발과 분포추정형 대리모델의 도입이 요구된다. 이러한 보완이 이루어진다면, 대리모델 기반 평가 체계는 과학적 정밀성과 정책적 실용성을 동시에 갖춘 국가 단위 기후변화 영향·취약성 평가 체계로 발전할 수 있을 것이다.

더 나아가, 본 연구에서 제시한 대리모델 기반 접근법은 농업 부문을 넘어 생태계의 생물계절·생물다양성, 기상 재해, 수자원, 보건 등 다양한 부문으로 확장될 수 있다. 이러한 확장은 국가 차원의 기후변화 적응 전략 수립에 필요한 과학적 근거를 강화하고, 정책–모델–데이터 간의 연계성을 심화시키는 기반 기술로서 중요한 역할을 수행할 것으로 기대된다.

Acknowledgments

본 연구는 농촌진흥청 공동연구사업 ‘기후 및 작부체계 변화에 따른 농경지 양분유출, 농업용수 수질 영향·취약성평가 및 적응기술 개발’(RS-2024-00396736)의 지원에 의해 이루어졌습니다.

References

Abbas SA, Bailey RT, White JT, Arnold JG, White MJ, Čerkasova N, Gao J. 2024. A framework for parameter estimation, sensitivity analysis, and uncertainty analysis for holistic hydrologic modeling using SWAT+. Hydrol Earth Syst Sci 28(1): 21-48. [https://doi.org/10.5194/hess-28-21-2024]
Abdalla M, Kumar S, Jones MB, Burke J, Williams M. 2011. Testing DNDC model for simulating soil respiration and assessing the effects of climate change on the CO₂ gas flux from Irish agriculture. Global Planet Change 78(1-2): 106-115. [https://doi.org/10.1016/j.gloplacha.2011.05.011]
Aleksandrova M, Gain A, Giupponi C. 2016. Assessing agricultural systems vulnerability to climate change to inform adaptation planning: An application in Khorezm, Uzbekistan. Mitigation Adapt Strategies Global Change 21: 1263-1287. [https://doi.org/10.1007/s11027-015-9655-y]
Antón J, Cattaneo A, Kimura S, Lankoski J. 2013. Agricultural risk management policies under climate uncertainty. Global Environ Change 23: 1726-1736. [https://doi.org/10.1016/j.gloenvcha.2013.08.007]
Arnold JG, Srinivasan R, Muttiah RS, Williams JR. 1998. Large area hydrologic modeling and assessment part I: Model development. J American Water Resour Assoc 34(1): 73-89. [https://doi.org/10.1111/j.1752-1688.1998.tb05961.x]
Azzellino A, Çevirgen S, Giupponi C, Parati P, Ragusa F, Salvetti R. 2015. SWAT meta-modelling as support of the management scenario analysis in large watersheds. Water Sci Technol 72(12): 2103-2111. [https://doi.org/10.2166/wst.2015.405]
Backlund P, Shahan D, Seepersad C. 2010. Metamodeling techniques for multidimensional ship design problems. Int J Nav Archit Ocean Eng 4: 43-54. [https://doi.org/10.25043/19098642.39]
Boote KJ, Jones JW, Hoogenboom G. 1998. CROPGRO: A model describing growth and development of grain legumes. In: Tsuji GY, Hoogenboom G, Thornton PK, (eds). Understanding options for agricultural production. Dordrecht:　Springer. p. 99-128. [https://doi.org/10.1007/978-94-017-3624-4_5]
Bouman BAM, Kropff MJ, Tuong TP, Wopereis MCS, Berge HFM, van Laar HH. 2001. ORYZA2000: Modeling lowland rice. Field Crops Res 71(1): 5-21. [https://doi.org/10.1016/S0378-4290(01)00100-6]
Box GE, Wilson KB. 1951. On the experimental attainment of optimum conditions. J R Stat Soc: Ser B 13(1): 1-45. [https://doi.org/10.1111/j.2517-6161.1951.tb00067.x]
Breiman L. 2001. Random forests. Mach Learn 45(1): 5-32. [https://doi.org/10.1023/A:1010933404324]
Chawanda CJ, Van Griensven A, Nkwasa A, Teran Orsini JP, Jeong J, Choi SK, Srinivasan R, Arnold JG. 2025. A high-resolution global SWAT+ hydrological model for impact studies. EGUsphere 2025: 1-27. [https://doi.org/10.5194/egusphere-2025-188]
Chen T, Guestrin C. 2016. XGBoost: A scalable tree boosting system. Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. p. 785-794. [https://doi.org/10.1145/2939672.2939785]
Choi SK, Lee BM, Jung GB, Jun SM, Eo J, Lee JM, Lee J. 2024. Proposal of model-based methodologies for assessing climate change vulnerability in agriculture: Focusing on nutrient discharge assessment in agricultural land using a linked APEX and regression model (in Korean with English abstract). J Clim Change Res 15(5-2): 873-887. [https://doi.org/10.15531/KSCCR.2024.15.5.873]
Del Grosso SJ, Mosier AR, Parton WJ, Ojima DS. 2005. DAYCENT model analysis of past and contemporary soil N₂O and net greenhouse gas flux for major crops in the USA. Soil Tillage Research 83(1): 9-24. [https://doi.org/10.1016/j.still.2005.02.007]
Droste N, May W, Clough Y, Börjesson G, Brady M, Hedlund K. 2020. Soil carbon insures arable crop production against increasing adverse weather due to climate change. Environ Res Lett 15. [https://doi.org/10.1088/1748-9326/abc5e3]
Eldred M, Giunta A, Wojtkiewicz S, Trucano T. 2002. Formulations for surrogate-based optimization under uncertainty. AIAA Paper. [https://doi.org/10.2514/6.2002-5585]
El-Mahroug SE, Suleiman AA, Zoubi MM, Al-Omari S, Abu-Afifeh QY, Al-Jawaldeh HF, Alta’any YA, Al-Nawaiseh TMF, Obeidat N, Alsoud SH, Alshoshan AM, Al-Shibli FM, Ta’any R. 2025. Predictive modeling of climate-driven crop yield variability using DSSAT towards sustainable agriculture. AgriEngineering 7: 156. [https://doi.org/10.3390/agriengineering7050156]
Fellmann T, Meybeck A, Lankoski J, Redfern S, Azzu N, Gitz V. 2012. The assessment of climate change-related vulnerability in the agricultural sector: reviewing conceptual frameworks. FAO Report: 37-61.
Ficklin DL, Luo Y, Luedeling E, Zhang M. 2013. Climate change and water resources in the Sacramento–San Joaquin River Basin. J Hydrol 519: 2437-2447. [https://doi.org/10.1016/j.jhydrol.2014.09.013]
Friedman JH. 2001. Greedy function approximation: A gradient boosting machine. Annals of Statistics 29(5): 1189-1232. [https://doi.org/10.1214/aos/1013203451]
Gal Y, Ghahramani Z. 2016. Dropout as a Bayesian approximation: Representing model uncertainty in deep learning. Proceedings of the 33rd International Conference on Machine Learning, New York, NY, USA, 2016.
Giltrap DL, Ausseil AGE. 2016. Upscaling NZ-DNDC using a regression-based meta-model to estimate direct N2O emissions from New Zealand grazed pastures. Science of the Total Environment 539: 221-230. [https://doi.org/10.1016/j.scitotenv.2015.08.132]
Gunawat A, Sharma D, Sharma A, Dubey SK. 2022. Assessment of climate change impact and potential adaptation measures on wheat yield using the DSSAT model in the semi-arid environment. Nat Hazards 111: 2077-2096. [https://doi.org/10.1007/s11069-021-05129-2]
Heng LK, Hsiao T, Evett S, Howell T, Steduto P. 2009. Validating the FAO AquaCrop model for irrigated and water-deficient field maize. Agron J 101(3): 488-498. [https://doi.org/10.2134/agronj2008.0029xs]
Hong J, Yoo H, Yu M, Song Y. 2021. DataBase Management System (DBMS) of Model Of InTegrated Impact and Vulnerability Evaluation for Climate Change (MOTIVE). EGUsphere. [https://doi.org/10.5194/egusphere-egu21-15656]
Hossain S, Atibudhi H, Mishra S. 2023. Agricultural vulnerability to climate change: A critical review of evolving assessment approaches. Grassroots J Nat Resour. [https://doi.org/10.33002/nr2581.6853.060107]
IPCC. 2001. Climate change 2001: Impacts, adaptation, and vulnerability. Contribution of working group II to the third assessment report of the Intergovernmental Panel on Climate Change. Cambridge University Press.
Jeong J, Arnold J, Park S, Sorando R, Choi SK, Kim MK. 2025. Enhancement of the SWAT+ model for simulating paddy rice cultivation and irrigation management in agricultural watersheds. J Hydrol 659: 133288. [https://doi.org/10.1016/j.jhydrol.2025.133288]
Johnston DB, Pembleton KG, Huth NI, Deo RC. 2023. Comparison of machine learning methods emulating process-driven crop models. Environ Modell Software 162: 105634. [https://doi.org/10.1016/j.envsoft.2023.105634]
Jones JW, Hoogenboom G, Porter CH, Boote KJ, Batchelor WD, Hunt LA, Wilkens PW, Singh U, Gijsman AJ, Ritchie JT. 2003. The DSSAT cropping system model. European J Agron 18(3-4): 235-265. [https://doi.org/10.1016/S1161-0301(02)00107-7]
Khan MS, Moallemi EA, Thiruvady D, Nazari A, Bryan BA. 2024. Machine learning-based surrogate modelling of a robust, sustainable development goal (SDG)-compliant land-use future for Australia at high spatial resolution. J Environ Manag 363: 121296. [https://doi.org/10.1016/j.jenvman.2024.121296]
Kamruzzaman M, Hwang S, Choi SK, Cho JP, Song I, Song JH, Jeong H, Jang T, Yoo S. 2020. Evaluating the impact of climate change on paddy water balance using APEX-Paddy model. Water 12(3): 852. [https://doi.org/10.3390/w12030852]
Kheir AMS, Mkuhlani S, Mugo JW, Elnashar A, Nangia V, Devare M, Govind A. 2023. Integrating APSIM model with machine learning to predict wheat yield spatial distribution. Agron J 115: 3188-3196. [https://doi.org/10.1002/agj2.21470]
Kropff MJ, van Laar HH, ten Berge HFM. 1993. ORYZA1: A basic model for irrigated lowland rice. International Rice Research Institute (IRRI), Manila, Philippines, p. 89.
Lakshminarayanan B, Pritzel A, Blundell C. 2017. Simple and scalable predictive uncertainty estimation using deep ensembles. 31st Conference on Neural Information Processing Systems, Long Beach, CA, USA.
LeCun Y, Bengio Y, Hinton G. 2015. Deep learning. Nature 521(7553): 436-444. [https://doi.org/10.1038/nature14539]
Li C, Cao Y, An X, Lyu D, Liu J. 2025. A hybrid-surrogate-calibration-assisted multi-fidelity modeling approach and its application in strength prediction for underwater gliders. J Mar Sci Eng. [https://doi.org/10.3390/jmse13030416]
Li C, Frolking S, Frolking TA. 1992. A model of nitrous oxide evolution from soil driven by rainfall events: 1. Model structure and sensitivity. J Geophys Res: Atmos 97(D9): 9759-9776. [https://doi.org/10.1029/92JD00509]
Li T, Angeles O, Marcaida M, Manalo E, Manalili M, Radanielson A, Mohanty S. 2017. From ORYZA2000 to ORYZA (v3): An improved simulation model for rice in drought and nitrogen-deficient environments. Agric For Meteorol 237-238: 246-256. [https://doi.org/10.1016/j.agrformet.2017.01.003]
Li Z, Nie Z, Li G. 2024. Integrating crop modeling and machine learning for the improved prediction of dryland wheat yield. Agronomy 14(4): 777. [https://doi.org/10.3390/agronomy14040777]
Ludwig B, Jäger N, Flessa H, Behrens T, Seidel SJ. 2011. Application of the DNDC model to predict N₂O emissions from arable soils with different fertilizer regimes. J Plant Nutr Soil Sci 174(2): 368-376. [https://doi.org/10.1002/jpln.201000207]
Lugato E, Paniagua L, Jones A, de Vries W, Leip A. 2017. Complementing the topsoil information of the Land Use/Land Cover Area Frame Survey (LUCAS) with modelled N₂O emissions. PLoS ONE 12(4): e0176111. [https://doi.org/10.1371/journal.pone.0176111]
McCown RL, Hammer GL, Hargreaves JNG, Holzworth DP. 1996. APSIM: A novel software system for model development, model testing and simulation in agricultural systems research. Agric Syst 50(3): 255-271. [https://doi.org/10.1016/0308-521X(94)00055-V]
Meinshausen N. 2006. Quantile regression forests. J Mach Learn Res 7: 983-999.
Neal RM. 1995. Bayesian learning for neural networks. University of Toronto. [https://doi.org/10.1007/978-1-4612-0745-0]
Nguyen TH, Nong D, Paustian K. 2019. Surrogate-based multi-objective optimization of management options for agricultural landscapes using artificial neural networks. Ecol Modell 400: 1-13. [https://doi.org/10.1016/j.ecolmodel.2019.02.018]
Niroula S, Cai X, McIsaac G. 2023. Sustaining crop yield and water quality under climate change in intensively managed agricultural watersheds—The need for both adaptive and conservation measures. Environmental Res Lett 18. [https://doi.org/10.1088/1748-9326/ad085f]
Oh K, Lee M, Jeon S. 2017. Development of the Korean climate change vulnerability assessment tool (VESTAP)—Centered on health vulnerability to heat waves. Sustainability 9: 1103. [https://doi.org/10.3390/su9071103]
Parker L, Bourgoin C, Martinez-Valle A, Läderach P. 2019. Vulnerability of the agricultural sector to climate change: The development of a pan-tropical climate risk vulnerability assessment to inform sub-national decision making. PLoS ONE 14(3): e0213641. [https://doi.org/10.1371/journal.pone.0213641]
Parton WJ, Hartman M, Ojima D, Schimel D. 1998. DAYCENT and its land surface submodel: Description and testing. Global Planet Change 19(1-4): 35-48. [https://doi.org/10.1016/S0921-8181(98)00040-X]
Perlman J, Hijmans RJ, Horwath WR. 2014. A metamodelling approach to estimate global N2O emissions from agricultural soils. Global Ecol Biogeogr 23(8): 912-924. [https://doi.org/10.1111/geb.12171]
Raes D, Steduto P, Hsiao TC, Fereres E. 2009. AquaCrop—The FAO crop model to simulate yield response to water: II. Main algorithms and software description. Agron J 101(3): 438-447. [https://doi.org/10.2134/agronj2008.0140s]
Rasmussen CE, Williams CK. 2006. Gaussian processes for machine learning. MIT Press. [https://doi.org/10.7551/mitpress/3206.001.0001]
Ritchie JT, Singh U, Godwin DC, Bowen WT. 1989. Cereal growth, development and yield. In: Jones J, Kiniry J (eds). CERES-Wheat: A simulation model of wheat growth and development. Texas A&M University Press.
Sarkar S, Gaydon D, Brahmachari K, Poulton P, Chaki A, Ray K, Ghosh A, Nanda M, Mainuddin M. 2021. Testing APSIM in a complex saline coastal cropping environment. Environ Modell Software 147: 105239. [https://doi.org/10.1016/j.envsoft.2021.105239]
Shahhosseini M, Hu G, Huber I, Archontoulis SV. 2021. Coupling machine learning and crop modeling improves crop yield prediction in the US Corn Belt. Sci Rep 11: 1606. [https://doi.org/10.1038/s41598-020-80820-1]
Steduto P, Hsiao TC, Raes D, Fereres E. 2009. AquaCrop—The FAO crop model to simulate yield response to water: I. Concepts and underlying principles. Agron J 101(3): 426-437. [https://doi.org/10.2134/agronj2008.0139s]
Stehfest E, Heistermann M, Priess J, Ojima D, Alcamo J. 2007. Simulation of global crop production with the ecosystem model DayCent. Ecol Modell 209: 203-219. [https://doi.org/10.1016/j.ecolmodel.2007.06.028]
Tao S, Xu Y, Liu K, Pan J, Gou S. 2011. Research progress in agricultural vulnerability to climate change. Adv Clim Change Res 2: 203-210. [https://doi.org/10.3724/SP.J.1248.2011.00203]
van der Veer S, Hamed R, Karabiyik H, Roskam J. 2024. Mitigating the effects of extreme weather on crop yields: Insights from farm management strategies in the Netherlands. Environ Res Lett 19. [https://doi.org/10.1088/1748-9326/ad7308]
Varadan R, Kumar P. 2015. Mapping agricultural vulnerability of Tamil Nadu, India to climate change: A dynamic approach to take forward the vulnerability assessment methodology. Clim Change 129(1-2): 159-181. [https://doi.org/10.1007/s10584-015-1327-0]
Wang J, Mendelsohn R, Dinar A, Huang J, Rozelle S, Zhang L. 2009. The impact of climate change on China’s agriculture. Agric Econ 40(3): 323-337. [https://doi.org/10.1111/j.1574-0862.2009.00379.x]
Williams JR, Izaurralde RC, Steglich EM. 2008. Agricultural policy/environmental extender model: Theoretical documentation. BRC Report No. 2008-16, Texas AgriLife Research, Texas A&M University.
Williams JR, Jones CA, Kiniry JR, Spanel DA. 1989. The EPIC crop growth model. Trans ASAE 32(2): 0497-0511. [https://doi.org/10.13031/2013.31032]
Xie Y. 2022. Combining CERES-Wheat model, Sentinel-2 data, and deep learning method for winter wheat yield estimation. Int J Remote Sens 43(2): 630-648. [https://doi.org/10.1080/01431161.2021.2024429]
Zhang X, Srinivasan R, Van Liew M. 2009. Approximating SWAT model using artificial neural network and support vector machine. J American Water Resour Assoc 45(2): 460-474. [https://doi.org/10.1111/j.1752-1688.2009.00309.x]
Zhang Z, Lu C, Tian W, Liao Z, Yuan Z. 2024. Graph neural network-based surrogate modelling for real-time hydraulic prediction of urban drainage networks. Water Res 263: 122142. [https://doi.org/10.1016/j.watres.2024.122142]
Zhao Y, Xiao D, Bai H, Tang J, Liu DL, Qi Y, Shen Y. 2023. The prediction of wheat yield in the North China Plain by coupling crop model with machine learning algorithms. Agriculture 13: 99. [https://doi.org/10.3390/agriculture13010099]

		Output type
		Point predictor	Probabilistic predictor (Emulator)
Learning paradigm	Statistical	- Splines - Generalized Linear Model (GLM) - Response Surface Methodology (RSM)	- Gaussian Process (GP, Kriging)
Learning paradigm	Machine Learning (ML)	- Random Forest (RF) - Gradient Boosting · XGboost, LightGBM - Neural Networks · Artificial Neural Network (ANN) · Convolutional Neural Network (CNN) · Recurrent Neural Network (RNN)	- Quantile Regression Forests (QRF) - Quantile Gradient Boosting (QGB) - Bayesian Neural Networks (BNN)

Study	Scale	Crop	Process based model	Surrogate model	Accuracy	Computational Efficiency
Johnston et al. (2023)	National (Australia)	Chickpea	APSIM NextGen	RF, ANN, MARS emulator	R²>0.95	200-500 x faster (ANN 200 x, MARS 500 x); extremely high efficiency
Shahhosseini et al. (2021)	National (U.S. Corn Belt)	Maize	APSIM	LASSO, RF, XGB, LightGBM	RMSE 7-20%↓; R² 0.25-30 p↑	Thousands x faster; real-time county-level predictions
Zhao et al. (2023)	Regional (North China Plain)	Wheat	APSIM	RF	r=0.86; RMSE=0.68 t/ha	Approx. 1-month lead time; moderate computational load
Li et al. (2024)	Regional (Gansu)	Wheat	APSIM	Weighted ensemble (APSIM, ML)	RMSE 43.5 kg/ha; RRMSE 3.55% improvement	Moderate efficiency improvement; suitable for regional scaling
Xie (2022)	Provincial (Henan, China)	Wheat	CERES-Wheat	LSTM (pretrained + retrained using Sentinel-2 LAI)	R² = 0.90; RMSE = 287 kg ha^-1	computationally lightweight compared to full PBM simulation
Kheir et al. (2023)	National (Egypt)	Wheat	APSIM NextGen	ANN (APSIMx_R hybrid)	d=0.95 (vs PBM d=0.89)	Tens of times faster; nationwide grid simulated within hours

Study	Scale	Focus	Process based model	Surrogate model	Accuracy	Computational efficiency
Zhang et al. (2009)	Watershed, USA (regional)	Streamflow & nutrient load	SWAT	ANN, SVM	R² = 0.834-0.996 (LREW); 0.728-0.941 (MCEW)	Reduced uncertainty analysis time by 20 ~ 35%
Azzellino et al. (2015)	Watershed, Italy (~ 2,000 km²)	Streamflow & nutrient load	SWAT	MLP (ANN)	R² = 0.90 (N), 0.97 (P)	Hours–days / scenario → Seconds >100× faster
Choi et al. (2024)	South Korea (national)	nutrient load	APEX	Nonlinear regression ML	R² = 0.53-0.72	National map generation within seconds

Study	Scale	Process based model	Surrogate model	Accuracy	Computational Efficiency
Perlman et al. (2014)	Global (0.5° grid, ~22,000 sites)	DNDC	Polynomial regression + regionalized meta-model	R² = 0.91 (Wheat), 0.97 (Maize)	45,000×faster than DNDC
Giltrap and Ausseil (2016)	National (New Zealand)	NZ-DNDC	Multiple linear regression (meta-model)	R² ≈ 0.69 between DNDC and meta-model outputs	computationally efficient for national-scale upscaling
Nguyen et al. (2019)	Regional (Colorado, USA; 290,000 ha)	DayCent	ANN surrogate coupled with multi-objective optimizer	ANN reproduced 99% of DayCent variability (R² > 0.99)	~ 10⁶×faster (6.2 million times faster than DayCent)
Lugato et al. (2017)	Continental (EU-27)	DayCent	Random forest meta-model	R² = 0.893, RMSE = 0.27-0.59 kg N / ha / yr	11 h (24-core) → seconds