텍스트 마이닝 기법을 활용한 국내 코로나19 유행 시기별 신재생에너지 뉴스 기사 분석
Abstract
This study analyzed news articles related to renewable energy, which shows different patterns from most energy sources, focusing on a decrease in supply and demand during the COVID-19 pandemic. A total of 20,602 news articles containing both renewable energy and COVID-19 keywords were collected in Python 3.9.6 from December 31, 2019, when the first case of COVID-19 was confirmed, to April 30, 2022, which included the period after social distancing was lifted. These articles were analyzed by text mining techniques to derive the flow and change of issues related to renewable energy. The collected news articles were refined with TEXTOM 6.0 and then the top 30 most frequently used words were extracted to understand the flow of issues on renewable energy. The significance of these words was evaluated through CONCOR analysis in order to determine the changes and characteristics of renewable energy issues according to the COVID-19 pandemic period. The results of this study can be used as a basis for establishing policies or developing business plans by identifying major issues related to renewable energy for situations related to the ongoing COVID-19 pandemic.
Keywords:
Renewable Energy, COVID-19, News Articles, Text Mining1. 서론
예상치 못한 코로나19 사태는 대공황 이후 전례 없는 경기침체와 경제·사회 구조 전반의 변화를 초래하였다(Government of the Republic of Korea, 2020). 코로나19의 전 세계적 확산이 본격화되면서 생산활동 둔화와 이동 제한에 따라 에너지 수요가 전반적으로 감소하면서 석탄, 석유, 가스 가격이 하락하고 관련 기업의 수익도 감소한 것으로 드러났다. 이와는 대조적으로 신재생에너지의 경우 미국과 중국 등을 중심으로 대규모 투자가 이루어지고 있고 2050년까지 기업에 필요한 전력을 100% 재생에너지로 조달하는 자발적 캠페인 RE100 (Renewable Energy 100%)에 대한 글로벌 기업들의 참여가 증가하면서(Kang, 2021; 2050 Carbon Neutrality and Green Growth Commission. 2022) 신재생에너지 발전량은 코로나19 유행기간 동안 오히려 증가한 것으로 나타났다(KEEI, 2020; KEMRI, 2020). 특히, 2050년 탄소중립 실현을 위한 국제사회의 대응이 본격화되면서 신재생에너지 보급이 확대되고 기존 화석연료 중심의 에너지 시스템에서 신재생에너지로의 전환이 가속화되고 있다(KEEI, 2021).
코로나19의 전 세계적 대유행이 지속되는 상황에서 에너지 부문에 대한 코로나19의 영향이 광범위하게 나타나면서 관련 연구들이 활발히 진행되고 있다. Roh (2020)는 유럽 수출 가격 변화를 분석하여 코로나19가 러시아의 석유와 가스 산업에 미치는 영향과 대응 방안에 대해 파악하였다. Bae (2020)는 코로나19 대응을 위한 재생에너지의 역할과 중요성을 아프리카 사례 연구를 통해 분석하였고, Naderipour et al.(2020)은 코로나19가 말레이시아의 재생에너지 발전량 증가에 미치는 긍정적 효과에 대해 연구하였다. Eroğlu (2020)는 재생에너지 공급과 정부의 인센티브 혜택에 대한 코로나19의 부정적인 영향에 대해 분석하였고 Hosseini (2020)는 코로나19가 재생에너지로의 전환 과정에 미치는 영향에 대해 정책적 측면에서 살펴보았다. Kim (2021a)은 인공위성 영상자료를 활용하여 코로나19 유행에 따른 야간 조명 강도의 지역별 차이를 분석하였다. Kim (2021b)은 코로나19 유행시기별 발전량 데이터를 분석하여 코로나19가 전력 시장에 미치는 영향을 파악하였고, Lee SJ (2021)는 시간별 전력 소비 데이터를 분석하여 코로나19가 국내 전력 소비량과 소비 패턴에 미치는 영향을 살펴보았다. Hoang et al.(2021)과 Hammoudeh et al.(2021)은 코로나19의 전 세계적 확산에 따른 국제유가 변동이 재생에너지로의 전환 과정과 재생에너지 시장에 미치는 영향에 대해 각각 분석하였다. Park (2021)은 전력 통계 데이터를 분석하여 코로나19 발생 전후의 전력 산업의 전기 판매량과 에너지원별 발전량의 변화를 비교하였다. 이외에도 코로나19 유행기간 동안 화석연료의 소비 감소와 재생에너지 전환에 따른 온실가스 배출량의 변화에 대한 연구들이 수행되었다(Mohideen et al., 2021; Rita et al., 2021; Adebayo et al., 2022). 이처럼 해외에서는 코로나19가 에너지 부문 전반에 미치는 영향에 대한 다양한 연구들이 진행되고 있으나 국내에서는 전력 수급 변화에 대한 연구가 주로 진행되고 있는 것으로 나타났다.
이러한 측면에서 본 연구에서는 코로나19의 전 세계적 확산 상황에서 수급 감소가 나타나는 에너지원들과 다른 패턴을 보이는 신재생에너지에 대해 알아보기 위해 텍스트 마이닝(Text Mining) 기법을 활용하여 뉴스 기사에 나타난 신재생에너지 이슈의 흐름을 분석하였다. 텍스트 마이닝(Text Mining)은 빅데이터 분석 방법의 하나로서 자연어로 구성된 대량의 비정형 텍스트 데이터(Unstructured Text Data)를 전처리 과정을 통해 데이터 속에 숨겨진 패턴이나 관계를 추출하여 의미있는 정보를 찾아내는 분석 방법이다(Kim et al., 2015; Park and Suh, 2015). 이러한 텍스트 마이닝은 특정 이슈의 흐름을 파악하기 위해 활용되고 있으며(Kim et al., 2020) 그동안 언론이나 문헌 연구 분야에서 주로 사용되던 것에서 점차 다양한 분야로 확대되고 있다(Choi et al., 2017). 따라서 본 연구에서는 이러한 텍스트 마이닝 기법을 활용하여 코로나19 발생이 처음 확인된 시점부터 뉴스 기사에 나타난 신재생에너지 이슈의 흐름을 파악하고, 코로나19 유행 시기별로 신재생에너지에 대한 이슈의 변화를 고찰하였다. 특히, 본 연구는 신재생에너지에 대한 코로나19의 영향을 뉴스 기사 분석을 통해 유행 시기별로 구분하여 분석한 첫 시도라는 점에서 의의가 있다.
2. 연구 방법
2.1. 자료 수집
본 연구에서는 중국 후베이성(湖北省) 우한시(武汉)에서 코로나19 발생이 처음 확인된 2019년 12월 31일(KDCA, 2022)부터 국내 집단감염 발생, 사회적 거리두기 조치 해제 등을 포함하는 기간인 2022년 4월 30일까지를 검색 범위로 설정하였다. 국내 집단감염 발생 시기별 구분은 중앙방역대책본부(2022)에서 국내 코로나19 첫 확진자 발생 시점부터 2년간 확진자 발생 현황 및 특성을 분석한 보고서에서 제시하고 있는 코로나19 유행 시기별 분류 기준을 근거로 하였다. ‘유행 1기’는 국내에서 코로나19 확진자가 처음 발생한 2020년 1월 20일부터 대구 신천지교회를 중심으로 집단감염이 발생한 시점을 포함하는 8월 11일까지, ‘유행 2기’는 2020년 8월 12일부터 수도권 종교시설 및 집회 관련 집단감염이 발생한 시점이 포함되는 11월 12일까지, ‘유행 3기’는 11월 13일부터 병원, 요양시설, 교정시설, 종교시설 등을 중심으로 집단감염이 발생한 시점을 포함하는 2021년 7월 6일까지, 마지막으로 ‘유행 4기’는 7월 7일부터 델타 변이와 오미크론 변이의 출현 및 확산 시점이 포함되는 2022년 1월 19일까지로 하였다.
전술한 검색 기간(’19.12.31. ~ ’22.4.30., 총 851) 동안 신재생에너지와 코로나19 키워드를 동시에 포함하는 뉴스 기사를 수집하기 위해 오픈소스 프로그래밍 언어인 파이썬(Python) 3.9.6 버전의 BeautifulSoup4 패키지를 활용하여 웹 크롤링(Web Crawling) 기법으로 642개 언론사에서 보도된 뉴스 기사 총 20,602건을 네이버(NAVER) 뉴스 포털로부터 수집하였다.
2.2. 자료 분석
텍스트 마이닝(Text Mining)은 대표적인 빅데이터(Big Data) 분석 방법의 하나로서 수집된 비정형 데이터에서 단어 출현빈도, 동시 출현빈도, 단어 간 관계 파악 등을 통해 의미 있는 정보를 추출하는 방법이다(Kim et al., 2015; Jeong and Jeon, 2019; Kim et al., 2020). 본 연구에서는 한국어 기반의 비정형 데이터 분석 프로그램인 텍스톰(TEXTOM) 6.0 버전을 활용하여 수집된 기사 20,602건에 대한 텍스트 마이닝을 수행하였다. 먼저 문장 내에서 특별한 의미가 없는 조사, 관사, 접속사, 부사 등의 불용어(Stopword)는 삭제하고, 코로나바이러스·코로나바이러스 감염증·신종 코로나바이러스 감염증·감염증(코로나19), 신재생 에너지 등과 같이 키워드와 동일한 의미로 사용된 단어들은 코로나19, 신재생에너지로 각각 통합하였다. 이렇게 키워드로 일원화하는 이유는 동일한 의미로 사용되지만 다르게 표현되는 경우 해당 단어의 빈도수가 낮게 추출되어 단어의 중요도나 연결 구조 등을 제대로 파악하기 어렵게 되기 때문이다(Jang and Hwang, 2021).
텍스트 전처리 과정을 거친 네이버 뉴스 기사들로부터 출현빈도가 높은 상위 30개 단어들을 텍스톰(TEXTOM) 6.0으로 추출하고 워드 클라우드(Word Cloud)를 생성하여 코로나19 유행 시기별 이슈의 흐름을 분석하였다. 출현빈도가 높은 단어일수록 뉴스 기사 내용을 대표하는 주제어일 가능성이 높지만 특별한 의미없이 대부분의 뉴스 기사들에 출현하는 단어도 있기 때문에(Son and Jeon, 2020; You et al., 2015), 단어 빈도-역문서 빈도(Term Frequency-Inverse Document Frequency, TF-IDF) 가중치 분석을 통해 텍스트 정제작업을 거친 뉴스 기사에 등장하는 단어들에 대한 중요도를 평가하였다.
사회 연결망 분석(Social Network Analysis) 전문 프로그램인 UCINET 6 (Borgatti et al., 2002)과 UCINET의 네트워크 시각화 툴인 NetDraw를 활용하여 출현빈도가 높은 상위 30개 단어들 간의 관계를 파악하기 위한 연결 중심성 분석을 수행하고, 이를 기반으로 유사한 특성을 보이는 단어들을 중심으로 형성되는 그룹을 도출하기 위한 반복상관관계수렴(CONvergence of iteration CORrealtion, CONCOR) 분석을 실시하였다.
3. 결과 및 고찰
3.1. 언론 보도 건수 및 단어 출현빈도 분석
본 연구에서는 중국 우한시에서 첫 코로나19 환자가 보고된 2019년 12월 31일부터 국내 유행 시기를 포함하는 2022년 4월 30일까지를 검색 기간으로 설정하여 642개 언론사로부터 신재생에너지와 코로나19 뉴스 기사 총 20,622건을 수집하였다. 분석 결과, 신재생에너지와 코로나19 키워드를 동시에 포함하는 뉴스 기사는 코로나19의 전국적 유행이 본격화되던 유행 1기부터 보도되기 시작한 것으로 나타났다. 우한시에서 코로나19 발생이 처음 보고된 2019년 12월 31일부터 국내 코로나19 첫 확진자가 발생한 2020년 1월 20일까지도 두 키워드를 모두 언급한 기사는 확인되지 않았으며(Fig. 1), 두 키워드를 동시에 포함하는 기사는 그로부터 22일이 지난 2월 12일부터인 것으로 확인되었다. 동일 기간에 대해 신재생에너지와 코로나19를 단독으로 검색했을 경우에는 각각 402개 언론사에서 3,350건, 389개 언론사에서 3,863건의 기사가 보도된 것으로 나타났다. 국내에서 첫 코로나19 확진자가 발생한 2020년 1월 20일부터 전국적으로 확산된 유행 4기까지(~ ’22.1.19.) 신재생에너지와 코로나19 키워드를 동시에 포함하는 뉴스 기사 18,629건이 620개 언론사로부터 보도된 것을 확인하였다. 이후 사회적 거리두기 조치 해제 전까지 400개 언론사에서 1,765건의 기사가 보도되고, 해제 당일부터 약 2주간 123개 언론사에서 208건의 기사가 보도된 것으로 나타났다(Fig. 1).
전술한 바와 같이 국내 첫 코로나19 확진자가 발생한 2020년 1월 20일(Yang et al., 2022)부터 세계보건기구(World Health Organization, WHO)에서 Coronavirus Disease-2019 (COVID-19)로 감염병의 공식명칭을 발표한 2월 11일(WHO, 2020a)까지 약 22일 기간 동안 신재생에너지와 코로나19 키워드를 동시에 포함하는 뉴스 기사는 확인되지 않았다. 전 세계적으로 코로나19 확진자 수가 급증하고 사망자도 발생하면서 3월 11일 WHO에서 코로나19에 대한 세계적 대유행(Pandemic)이 공식 선언(WHO, 2020b)된 후 신재생에너지와 코로나19가 동시에 언급된 뉴스 기사 수는 전월 대비 약 6배 이상 증가하였고 이후 계속 증가 추세를 보이면서 유행 1기(’20.1.20. ~ ’20.8.11., 204일) 동안 1,553개 언론사에서 총 5,195건의 기사가 수집되었다(Fig. 1). 워드 클라우드(Word Cloud) 분석 결과, 신재생에너지, 코로나19, 사업, 에너지, 태양광, 지원, 확대 등의 단어들이 주로 나타나는 것을 확인하였다(Fig. 2a). 이 외에도 정부, 정책, 투자, 경제, 뉴딜, 그린뉴딜 등의 출현빈도가 높게 나타나 예상치 못한 코로나19에 따른 경기침체와 경제·사회 전반의 구조적 변화 등에 대응하기 위해 정부에서 발표한 「한국판 뉴딜」 종합계획 발표(Government of the Republic of Korea, 2020)에 대한 관심에서 비롯된 것으로 보인다. 유행 2기(’20.8.12. ~ ’20.11.12., 92일)에는 1,037개 언론사에서 총 3,354건의 기사가 보도되었다. 유행 2기의 워드 클라우드는 신재생에너지를 중심으로 코로나19, 사업, 에너지, 확대, 친환경, 정부 등의 출현빈도가 높게 나타나 유행 1기와 유사한 패턴을 보였다(Fig. 2b).
코로나19 전체 유행 기간 중 가장 기간이 긴 유행 3기(’20.11.13. ~ ’21.7.6., 235일)에는 1,459개 언론사에서 보도된 기사 3,218건이 수집되었다. 워드 클라우드 분석 결과, 유행 1, 2기와 다르게 유행 3기에서는 처음으로 신재생에너지보다 코로나19가 높은 출현빈도를 보였다(Fig. 2c). 그동안 수도권을 중심으로 확산세를 보이던 코로나19가 전국으로 확대되어 유행 2기 대비 일 평균 확진자 수가 3배, 사망자수는 7배 이상 증가하고(Yang et al., 2022) 국내에서 코로나19 백신 예방접종이 시작되면서(MOHW, 2021) 전국적으로 코로나19에 관한 관심이 급증한 것에서 비롯된 것으로 보인다. 코로나19 다음으로 신재생에너지, 에너지, 사업, 친환경 등 1, 2기에서 많이 언급되었던 단어들이 유행 3기에서도 높은 출현빈도를 보였다. 마지막으로 유행 4기(’21.7.7. ~ ’22.1.19., 196일)에는 2,073개 언론사로부터 총 6,862건의 기사가 수집되어 코로나19 전체 유행 기간을 통틀어 가장 많은 기사가 보도된 것을 확인하였다. 유행 4의 워드 클라우드 분석 결과 신재생에너지가 주요 키워드로 확인되었고 그 뒤를 이어 에너지, 코로나19, 사업, 확대, 상황, 투자, 친환경, 기업 등의 순으로 단어들의 출현빈도가 이전 유행 시기들과는 확연히 다른 패턴을 보였다. 이외에 태양광, 탄소중립, 장기(Long-term), 회복 등의 단어도 많이 언급되고 있었다(Fig. 2d). 정부의 2050 탄소중립 선언 후속 조치로 2030 국가 온실가스 감축목표(Nationally Determined Contribution, NDC) 상향안이 국제사회에 발표되면서(Government of the Republic of Korea, 2021a) 부문별 상향된 감축목표 이행의 주요 수단 중의 하나인 신재생에너지와 관련 사업 등에 대한 관심이 증가한 것에서 비롯된 것으로 보인다.
유행 4기 이후부터 정부의 사회적 거리두기 조치 해제 하루 전까지(’22.1.20. ~ ’22.4.17., 87일) 400개 언론사에서 총 1,765건의 기사가 수집되었다. 워드 클라우드 분석 결과, 신재생에너지가 가장 높은 출현빈도를 보였고, 사업, 에너지, 확산, 코로나19, 기업, 전환 등이 주로 나타났으며 이외에 전력, 태양광, 성장, 수소 등도 많이 언급된 것으로 확인되었다. 2050 탄소중립 실현을 위한 정부의 신재생에너지 공급 의무화 비율 상향 조정안(Government of the Republic of Korea, 2021b)이 발표됨에 따라 태양광과 함께 에너지 전환을 이끌 잠재력을 보유한 수소에 대한 관심이 새롭게 나타난 것으로 보인다. 전국적 확산세가 다소 꺾이고 사회적 거리두기 조치 해제를 앞둔 시점에서 코로나19는 전 기간에 걸쳐 가장 낮은 출현빈도를 보였다(Fig. 2e).
정부의 사회적 거리두기 조치 해제가 코로나19와 신재생에너지 관련 뉴스 기사 보도에 미치는 영향을 알아보기 위해 해제 당일인 4월 18일부터 30일까지 약 2주 간의 기사 자료 총 208건을 123개 언론사로부터 추가로 수집하여 분석하였다. 워드 클라우드 분석 결과, 신재생에너지, 에너지, 코로나19, 사업, 시장, 투자 등의 출현빈도가 높게 나타나 사회적 거리두기 조치 해제 직전 시점 보도와 비교하여 크게 달라진 내용은 없는 것으로 나타났다(Fig. 2f). 다만, 코로나19 유행 시기에는 자주 언급되지 않았던 중소기업, 산업생태계, 지원사업, 기후위기, 자립 등이 새롭게 상위 출현빈도 단어로 추가된 것이 확인되었다. 이는 사회적 거리두기 해제로 그동안 코로나19로 위축되었던 경제 활성화, 러시아와 우크라이나 전쟁의 장기화에 따른 원유 및 가스 가격 상승과 에너지 수급 불안정성 심화에 대응하기 위한 신재생에너지 관련 개발 및 투자 확대 생황에서 비롯된 것으로 보인다.
3.2. 단어 빈도-역 문서 빈도(TF-IDF) 분석
단어 빈도-역 문서 빈도(TF-IDF)는 문서 내에서 사용된 단어의 중요도를 평가하기 위해 텍스트마이닝에서 많이 활용되는 방법이다. 특정 단어가 전체 문서에서 출현하는 빈도가 낮고 반대로 적은 수의 문서에서는 사용되는 빈도가 높을수록 TF-IDF는 큰 값을 나타내며 문서의 내용을 대표하는 주제어일 가능성이 크다(Lee and Kim, 2009; Go et al., 2011; You et al., 2015). 전체 문서에서 흔하게 사용되어 TF-IDF 값이 작게 나타나는 단어들을 제거할 수 있기 때문에 문서별로 중요한 단어에 대한 분석이 가능하게 된다(Son and Jeon, 2020). 본 연구에서는 이러한 TF-IDF 분석을 통해 코로나19 유행 시기별 상위 30개 핵심어를 추출하여 코로나19와 신재생에너지 뉴스 기사에서 사용된 단어들의 중요도를 파악하였다(Table 1).
TF-IDF로 추출된 상위 30개 핵심어는 코로나19 유행 시기별로 다른 패턴을 보이는 것으로 나타났다. 유행 1기에는 코로나19의 중요도가 가장 높았고, 유행 2기와 유행 4기 이후부터 사회적 거리두기 조치 해제 전까지는 사업이 가장 높았으며, 유행 3기와 4기, 사회적 거리두기 해제 기간에는 에너지의 중요도가 가장 높은 것으로 나타났다. 반대로 유행 시기별로 계획, 발전, 풍력, 회복, 세계, 자립 순으로 TF-IDF가 가장 낮은 것으로 드러났다(Table 1). 이를 통해, 유행 초기에는 모든 뉴스 기사에서 코로나19가 중요하게 다루어지고 있었으나 시간이 지나면서 에너지, 사업, 투자 등이 점점 중요해졌음을 알 수 있다. TF-IDF 상위 30개 핵심어는 단어 출현빈도(TF)의 상위 30개 단어(Fig. 2)와 비교했을 때 단어 구성과 순위에서도 다소 차이를 보이는 것으로 나타났다. 코로나19는 TF-IDF와 단어 출현빈도의 결과가 매우 유사한 것으로 나타났으나 유행 3기에는 상위 30개 핵심어에 포함되지 않을 정도로 TF-IDF의 순위가 낮은 것으로 확인되었다. 이와 대조적으로 신재생에너지의 경우 전체 기사에서 TF-IDF가 중하위권에 머무른 것으로 나타나 유해 3기를 제외하고 항상 최상위권을 차지했던 단어 출현빈도 분석 결과(Fig. 2)와는 차이를 보였다. 또한 단어 출현빈도의 상위 30개 단어에는 포함되지 않았던 풍력(유행 3기)과 원자력(사회적 거리두기 해제 기간)이 TF-IDF에는 새롭게 추가된 것이 확인되었다(Table 1).
3.3. 연결 중심성 분석
연결 중심성(Centrality)은 키워드 간의 연결 정도를 나타내는 것으로 연결 중심성이 높은 키워드는 네트워크에서 다양한 키워드들과의 연결 관계를 갖는 중심적인 역할을 하는 것으로 해석할 수 있다(Hong and Oh, 2016; Lee, GS, 2021). 네트워크 상에서 노드의 크기는 키워드의 연결 중심성의 정도를 나타내고 연결선의 굵기는 키워드 간의 연결 정도를 나타낸다(Lee and Moon, 2021). 따라서 노드의 크기가 큰 키워드는 연결 중심성이 높고 연결선의 굵기가 굵으면 키워드 간의 연결 강도가 높은 것을 의미한다.
Fig. 3은 신재생에너지와 코로나19 뉴스 기사에서 출현빈도가 높은 상위 30개 핵심어에 대한 연결 중심성을 분석하여 유행 시기별로 시각화한 것이다. 유행 1기의 경우 신재생에너지를 중심으로 코로나19, 사업, 확대, 태양광, 지원, 에너지, 정책 등의 연결 중심성이 높고 신재생에너지와의 연결 강도도 높게 나타났다(Fig. 3a). 유행 2기는 유행 1기와 마찬가지로 신재생에너지의 연결 중심성이 가장 높고 사업, 확대, 친환경, 에너지, 정부 등과의 연결 강도가 높은 것으로 나타나 유행 1기와 유사한 결과를 보였다(Fig. 3b). 유행 3기에서는 이전 유행 시기들과는 다른 패턴이 나타났다. 그동안 신재생에너지를 중심으로 네트워크가 형성된 것과 달리 유행 3기에서는 코로나19를 중심으로 신재생에너지, 에너지, 사업, 친환경, 확대, 기업, 태양광 등의 연결 중심성이 형성되고 연결 강도가 높게 나타났다(Fig. 3c). 유행 4기는 다시 신재생에너지를 중심으로 확대, 에너지, 사업, 코로나19, 투자, 친환경, 기업 등의 순으로 연결 중심성이 높고 코로나19의 연결 중심성은 이전 시기들에 비해 다소 낮아진 것으로 나타났다(Fig. 3d). 유행 4기 이후부터 사회적 거리두기 조치 해제 전까지는 유행 4기와 유사한 결과를 보였다. 신재생에너지를 중심으로 사업, 에너지, 확산, 기업, 코로나19, 확대, 친환경 등의 연결 중심성이 높고 코로나19의 연결 중심성은 낮은 것으로 나타났다(Fig. 3e). 마지막으로 사회적 거리두기 조치 해제 기간에는 신재생에너지의 연결 중심성이 가장 높고 에너지, 상황, 코로나19, 친환경, 사업, 시장, 투자 등과의 연결 강도가 높게 나타났다(Fig. 3f).
3.4. 반복상관관계수렴(CONCOR) 분석
반복상관관계수렴(CONCOR) 분석은 전체 네트워크 내에서 단어 간의 연결 관계와 패턴을 파악하기 위해 사용되는 대표적인 클러스터링(Clustering) 방법으로, 도출된 클러스터(Cluster)는 유사성이 높은 단어들로 구성되기 때문에 공통된 주제를 파악할 수 있으며 기사 내에서 해당 단어가 사용된 의미의 유추가 가능해진다(Cho, 2018; Kang et al., 2018; Kim and Kim, 2019). 본 연구에서는 이러한 CONCOR 분석을 통해 신재생에너지와 코로나19 뉴스 기사의 상위 30개 키워드 네트워크(Fig. 3) 내에서 유사한 특성을 가진 키워드를 중심으로 형성되는 그룹을 도출하여 그 결과를 시각화하였다(Fig. 4). CONCOR 분석 결과 코로나19 유행 시기별로 클러스터의 특성과 구성이 차이를 보이는 것으로 나타났다.
유행 1기의 경우 뉴딜, 그린 뉴딜, 대응 현황, 태양광 사업 관련 네 개의 클러스터가 형성된 것으로 나타났다(Fig. 4a). 뉴딜 클러스터에는 예상치 못한 코로나19 사태로 인한 경기침체를 극복하고 경제·사회 전반의 구조적 변화(Government of the Republic of Korea, 2020)에 대응하기 위한 단어들인 코로나19, 신재생에너지, 기업, 산업, 투자 등이 포함되어 있었으며, 그린 뉴딜 클러스터에는 친환경·저탄소 경제에 대한 요구 증대와 그린 경제로의 전환 촉진(Government of the Republic of Korea, 2020)을 위한 친환경, 경제, 지원, 계획, 추진 등의 단어들이 포함되어 있었다. 대응 현황 클러스터에는 세계, 정책, 사회, 시장, 개발 등 코로나19의 전 세계적 유행에 따른 영향 및 대응 관련 단어들이 포함되었다. 유행 2기 클러스터는 그린 뉴딜, 위기 극복, 신재생에너지 투자, 사업 확대 등으로 유행 1기와 클러스터의 패턴은 유사하지만 단어 구성에서 차이를 보이는 것으로 나타났다(Fig. 4b). 유행 2기의 그린 뉴딜 클러스터에는 정책, 뉴딜, 확산 등의 단어들이 새롭게 포함되었고, 위기 극복 클러스터에는 코로나19 여파로 전 세계 석유 수요 감소(KEEI, 2020)와 이로 인한 에너지 전환의 가속화 상황과 관련된 전환, 세계, 미국, 정부, 대응 등의 단어가 포함되어 있었다. 신재생에너지 시장 클러스터에는 코로나19, 신재생에너지, 태양광, 기업, 시장, 투자 등의 단어가 포함된 것으로 나타났다. 유행 3기에는 에너지 전환, 기술 개발 및 지원, 신재생에너지 사업, 친환경 에너지 클러스터가 형성되었다(Fig. 4c). 에너지 전환 클러스터에는 태양광, 전환, 정책, 투자, 확대 등 화석 연료에서 신재생에너지로의 전환을 위한 적극적 의지가 표명된 단어들이 포함된 것으로 나타났다. 기술 개발 및 지원 클러스터에는 글로벌, 국내, 디지털, 기술, 개발 등의 단어들이 포함되었고, 신재생에너지 사업 클러스터에는 코로나19, 신재생에너지, 정부, 기업, 추진 등의 단어들이 포함되어 있었다. 유행 4기는 탄소중립, 신재생에너지 사업, 경기 회복, 코로나19 클러스터가 형성되었다(Fig. 4d). 탄소중립 클러스터에는 탄소중립, 전환, 정부, 기업, 지원 등의 단어가 포함되었고, 신재생에너지 사업 클러스터에는 신재생에너지, 태양광, 친환경, 경제, 추진 등의 단어가 포함되어 있었다. 경기 회복 클러스터에는 코로나19 유행 확산세가 다소 완화되고 내수 경기가 회복세를 보이면서 관련 단어들인 수요, 증가, 개발, 회복 등의 단어가 포함된 것으로 나타났다.
유행 4기 이후부터 사회적 거리두기 조치 해제 전까지는 전력, 에너지 전환, 신재생에너지 시장, 코로나19 클러스터가 형성되었다(Fig. 4e). 전력 클러스터에는 코로나19로 인한 글로벌 경기 침체가 점차 회복되기 시작하면서 전력 수요가 증가하여 글로벌, 전력, 산업, 기업, 투자 등 관련 단어가 포함된 것으로 나타났다. 에너지 전환 클러스터의 경우, 유행 3기에 포함되었던 태양광 대신 수소가 새롭게 포함되었고 이외에 친환경, 성장, 지원, 증가 등의 단어도 추가된 것으로 드러났다. 신재생에너지 시장 클러스터의 경우에는 신재생에너지, 태양광, 정부, 시장, 확산 등의 단어가 포함되어 있었다. 마지막으로 사회적 거리두기 조치 해제 기간에는 탄소중립, 신재생에너지 확산, 중소기업, 활용 관련 클러스터가 형성되었다(Fig. 4f). 탄소중립 클러스터에는 탄소중립, 기후위기, 태양광, 친환경, 사업, 추진, 확대 등의 단어가 포함된 것으로 나타나 전환, 정부, 기업, 지원 등의 단어로 구성된 유행 4기의 탄소중립 클러스터에서 본격적으로 탄소중립 이행을 위한 진행 상황이 반영된 것으로 보인다. 신재생에너지 확산에는 글로벌, 세계, 에너지, 투자, 코로나19 등의 단어가 포함되어 있었다. 중소기업 클러스터에는 중소기업, 지원사업, 자립, 주도, 산업생태계 등의 단어가 포함된 것으로 나타났다. 이는 사회적 거리두기 조치 해제 영향으로 이전 시기들과는 다른 새로운 유형의 클러스터가 형성된 것으로 보인다. 유행 1기에서 3기까지는 신재생에너지와 코로나19가 모두 같은 클러스터에 포함되어 있었으나 유행 4기부터 사회적 거리두기 조치 해제 전까지는 각각 다른 클러스터에 포함되어 있었다. 이 경우, 신재생에너지는 다수의 키워드로 구성된 중심 클러스터를 형성하였으나 코로나19는 그렇지 않은 것으로 드러났다. 사회적 거리두기 조치 해제 기간에는 신재생에너지와 코로나19가 다시 같은 클러스터에 포함된 것으로 나타났다.
이처럼 CONCOR 분석을 통해 도출된 클러스터의 형태와 구성의 변화를 통해 뉴스 기사에 나타난 코로나19 유행 시기별 신재생에너지 관련 이슈의 변화 과정에 대한 파악이 가능하였다. 정리하면, 신재생에너지 이슈는 코로나19 유행 시기별로 신재생에너지 투자(유행 1기), 사업(유행 2, 3, 4기), 시장(유행 4기 이후), 확산(사회적 거리두기 조치 해제 기간)으로 전개되는 것을 확인할 수 있었다.
4. 결론
코로나19의 전 세계적 확산이 본격화되고 장기화되면서 세계 각국이 확산 방지를 위해 이동 제한이나 국경봉쇄 조치를 시행하여 경제활동이 크게 위축되면서 전 세계적으로 에너지 소비 감소가 나타났다. 이러한 코로나19 여파로 석탄, 석유, 가스 등 화석연료의 수요 감소와 가격 하락이 초래된 것에 비해 신재생에너지의 경우에는 투자 확대와 발전량 증가로 성장세를 지속하고 있는 것으로 드러났다. 본 연구에서는 이처럼 코로나19의 전 세계적 대유행이 지속되는 상황에서 수급 감소가 나타나는 대부분의 에너지원과 다른 패턴을 보이는 신재생에너지에 대해 분석하기 위해 코로나19 발생이 처음 확인된 2019년 12월 31일부터 전국적 유행 확산, 확산세 완화, 정부의 사회적 거리두기 조치 해제 등을 포함하는 기간인 2022년 4월 30일까지 2년 4개월(총 851일)간 신재생에너지와 코로나19 키워드를 동시에 포함하는 뉴스 기사 총 20,602건을 네이버 뉴스 포털에서 파이썬(Python) 3.9.6으로 수집하여 코로나19 유행 시기별 뉴스 기사에 나타난 신재생에너지 이슈의 흐름과 변화를 분석하였다. 수집된 뉴스 기사는 텍스톰(TEXTOM) 6.0으로 정제작업을 거친 다음 출현빈도가 높은 상위 30개 키워드를 추출하여 코로나19 유행 시기별 이슈의 흐름을 파악하고, 뉴스 기사에 등장하는 단어의 중요도를 평가하여 코로나19 유행 시기별 신재생에너지 이슈의 변화와 특성을 도출하였다.
단어 출현빈도 분석 결과 코로나19 유행 초기에는 사업, 에너지, 태양광, 지원, 확대, 친환경, 정부, 그린뉴딜 등의 키워드가 출현하여 신재생에너지 보급 확대를 위한 정부의 정책 및 지원 사업 등이 주요 이슈인 것으로 드러났다. 유행 말기에는 에너지, 사업, 확대, 투자, 기업 등의 키워드와 함께 태양광, 탄소중립, 장기, 회복 등의 출현빈도도 높게 나타났다. 유행 초기 정부 주도의 신재생에너지 보급 확대에서 유행 말기 기업 중심의 투자 확대로 이어졌고 유행 초기와 마찬가지로 태양광이 여전히 주요 이슈였다. 특히, 이 시기에는 코로나19 확산세가 다소 완화 조짐을 보이면서 경기 회복에 대한 관심이 높아지기 시작하였고 이러한 이슈의 흐름은 사회적 거리두기 조치 해제 기간으로 이어졌다. 유행 4기 이후부터 사회적 거리두기 조치 해제 기간에는 세계 경기침체가 서서히 회복세를 보이면서 사업, 에너지, 기업, 전환, 전력, 태양광, 성장, 수소 등의 키워드가 등장하여, 신재생에너지원으로서 수소가 새로운 이슈로 주목을 받는 것으로 나타났다. 이와 같은 단어 출현빈도는 해당 단어가 특별한 의미 없이 뉴스 기사에 자주 출현하는 경우도 있기 때문에 본 연구에서는 뉴스 기사의 내용을 대표하는 핵심 단어를 추출하기 위해 TF-IDF 분석을 수행하여 단어 출현빈도의 분석 결과와 비교하였다. TF-IDF로 추출된 상위 30개 핵심어는 코로나19 유행 시기별로 다른 패턴을 보인다는 점에서는 단어 출현빈도와 유사한 결과를 보였으나 단어 구성과 순위는 차이를 보이는 것으로 나타났다. TF-IDF 분석 결과 유행 초기에는 코로나19가 뉴스 기사에서 주요 주제였으나 유행 말기로 가면서 에너지, 사업, 친환경 등이 점점 중요하게 다루어지는 것으로 분석되었다. 또한 단어 출현빈도 상위 30위에는 포함되지 않았던 풍력, 원자력, 후보자 등이 핵심어로 추출되었다. 연결 중심성 분석 결과는 단어 출현빈도와 TF-IDF 분석 결과와 유사하게 코로나19 유행 시기별로 신재생에너지와 코로나19 키워드의 연결 중심성이 가장 높고 이를 중심으로 출현빈도와 중요도가 높은 키워드들의 연결 강도가 높게 나타났다. 또한 CONCOR 분석으로 도출된 코로나19 유행 시기별 클러스터의 형태 및 변화를 통해 투자(유행 1기), 사업(유행 2, 3, 4기), 시장(유행 4기 이후 ~ 사회적 거리두기 조치 해제 전), 확산(사회적 거리두기 조치 해제 기간)으로 이어지는 신재생에너지에 대한 이슈의 흐름이 변화하는 과정을 확인할 수 있었다.
본 연구에서는 비정형 데이터인 뉴스 기사에 나타난 신재생에너지에 대한 이슈의 흐름과 변화를 텍스트 마이닝 기법을 활용해 코로나19 유행 시기별로 구분하여 분석하였다. 이러한 분석 결과는 코로나19 유행이 지속되는 상황에서 신재생에너지에 대한 주요 이슈를 파악하여 관련 정책이나 사업 계획을 수립하는데 기초자료로 활용될 수 있을 것이다. 다만 코로나19가 아직 종식되지 않은 상황인 점을 고려하여 코로나19 유행 전 기간에 걸쳐 나타난 신재생에너지에 대한 이슈의 흐름과 변화에 대한 종합적인 분석을 위해 코로나19 종식 이후 보도된 뉴스 기사들에 대한 추가 분석이 필요할 것으로 보인다.
Acknowledgments
본 연구는 과학기술정보통신부 한국건설기술연구원 연구운영비지원(주요사업)으로 수행되었습니다(과제번호 20220176-001, 2050 건축·도시 탄소중립 구현을 위한 기반 구축 연구; 과제번호 22020260-001, 공공데이터 기반 건물에너지 광역 검진 기술 개발).
References
- Adebayo TS, Abdul H, Bilal, Kirikkaleli D, Shah MI, Abbas S. 2022. CO2 behavior amidst the COVID-19 pandemic in the United Kingdom: The role of renewable and non-renewable energy development. Renewable Energy 189(2022):492-501. [https://doi.org/10.1016/j.renene.2022.02.111]
- Bae YJ. 2020. The Importance of Renewable Energy in Africa During the Era of COVID-19: A case study of Malawi. Journal of the Korean Association of African Studies 61:33-68.
- Borgatti SP, Everett MG, Freeman LC. 2002. UCINET for Windows: Software for social network analysis. Harvard, MA: Analytic Technologies.
- Cho SH. 2018. A Study on analysis of the trend of blockchain by key words network analysis. The Journal of Korea Institute of Information, Electronics, and Communication Technology 11(5):550-555 (in Korean with English abstract).
- Choi JG, Jin SH, Choi JH. 2017. A study on differences of aspect of report by news media using text mining analysis. Journal of The Korean Data Analysis Society 19(5):2509-2522 (in Korean with English abstract). [https://doi.org/10.37727/jkdas.2017.19.5.2509]
- Eroğlu H. 2020. Effects of Covid-19 outbreak on environment and renewable energy sector. Environment, Development and Sustainability 23:4782-4790. [https://doi.org/10.1007/s10668-020-00837-4]
- Go GS, Jung WK, Shin YG, Park SS, Jang DS. 2011. A study on development of patent information retrieval using text mining. Journal of the Korea Academia-Industrial cooperation Society 12(8):3677-3688 (in Korean with English abstract). [https://doi.org/10.5762/KAIS.2011.12.8.3677]
- Government of the Republic of Korea. 2020. The Korean New Deal-National strategy for a great transformation.
- Government of the Republic of Korea. 2021a. The Republic of Korea’s enhanced update of its first Nationally Determined Contribution.
- Government of the Republic of Korea. 2021b Oct 6. Renewable energy mandatory supply ratio raised to 25% by 2026. Press release.
- Hammoudeh S, Mokni K, Ben-SalhaAhdi O, Ajimi AN. 2021. Distributional predictability between oil prices and renewable energy stocks: Is there a role for the COVID-19 pandemic?. Energy Economics 103(2021):1-12. [https://doi.org/10.1016/j.eneco.2021.105512]
- Hoang AT, Nižetić S, Olcer. A, Ong HC, Chen TC, Thomas S, Bandh S, Nguyen XP. 2021. Impacts of COVID-19 pandemic on the global energy system and the shift progress to renewable energy: Opportunities, challenges, and policy implications. Energy Policy 154:1-11. [https://doi.org/10.1016/j.enpol.2021.112322]
- Hong JS, Oh IK. 2016. Image difference of before and after an incident using social big data analysis: Focusing on a ramp return of “K” airline. International Journal of Tourism and Hospitality Research 30(6):119-133 (in Korean with English abstract). [https://doi.org/10.21298/IJTHR.2016.06.30.6.119]
- Hosseini SH. 2020. An outlook on the global development of renewable and sustainable energy at the time of COVID-19. Energy Research & Social Science 68:1-3. [https://doi.org/10.1016/j.erss.2020.101633]
- Jang JM, Hwang SH. 2021. Analysis of the semantic network of major issues of the 2020 Tokyo Olympics. The Korean Journal of Physical Education 60(6):293-307 (in Korean with English abstract). [https://doi.org/10.23949/kjpe.2021.11.60.6.21]
- Jeong KH, Jeon IK. 2019. A study on analyze of ‘Gocheok Sky Dome’ using big data text-mining analysis. The Korean Society of Sports Sciences 28(3):443-454 (in Korean with English abstract). [https://doi.org/10.35159/kjss.2019.06.28.3.443]
- Kang JH. 2021. Renewable energy industry trend. 2021 Quarterly Report. The Export-Import Bank of Korea.
- Kang WG, Ko ES, Lee HR, Jim JN. 2018. A study of the consumer major perception of packaging using big data analysis-Focusing on text mining and semantic network analysis. Journal of the Korea Convergence Society 9(4):15-22 (in Korean with English abstract).
- KEPCO Economy & Management Research Institute (KEMRI). 2020. The impact of COVID-19 on energy transition and new and renewable energy. Global Trends.
- Kim EJ, Sim HM, Won JW, Kang BJ. 2020. Mapping the COVID-19 issues from an urban perspective in South Korea-Text mining analysis focused on newspaper articles. Urban Design Institute of Korea 21(6):163-179 (in Korean with English abstract). [https://doi.org/10.38195/judik.2020.12.21.6.163]
- Kim HJ, Jo NO, Shin KS. 2015. Text Mining-Based Emerging Trend Analysis for the Aviation Industry. Journal of Intelligence and Information Systems 21(1):65-82 (in Korean with English abstract). [https://doi.org/10.13088/jiis.2015.21.1.65]
- Kim MH. 2021a. The Spatio-temporal Change of Nighttime Lights Intensity in Provinces, South Korea, during COVID-19 Pandemic Era. The Geographical Journal of Korea 55(2):183-192. [https://doi.org/10.22905/kaopqj.2021.55.2.4]
- Kim SG, Kim JH. 2019. A Visualization of movie reviews based on a semantic network analysis. Journal of the Korea Institute of Information and Communication Engineering 23(1):1-6 (in Korean with English abstract).
- Kim SI. 2021b. The Impact of COVID-19 on the electricity supply and demand of Korea. Korea Energy Economics Institute (KEEI). Research Report.
- Korea Disease Control and Prevention Agency (KDCA). 2022. Coronavirus (COVID-19), Republic of Korea; [accessed 2022 October 6]. http://ncov.mohw.go.kr/en/
- Korea Energy Economics Institute (KEEI). 2020. The impact of COVID-19 on energy industry in the first half of 2020. KEEI Issue Brief.
- Korea Energy Economics Institute (KEEI). 2021. Analysis on the outcome of energy transition policy and further direction.
- Lee GS. 2021. Semantic network analysis on preschooler safety in the COVID-19 using big data. The Journal of Child Education 30(4):197-213 (in Korean with English abstract). [https://doi.org/10.17643/KJCE.2021.30.4.11]
- Lee JS, Moon SJ. 2021. A study on keyword analysis related to travel stress in the Post-Corona era using big data. The Society of Convergence Knowledge Transactions 9(4):87-94.
- Lee SG, Kim HJ. 2009. Keyword extraction from news corpus using modified TF-IDF. The Journal of Society for e-Business Studies 14(4):59-73 (in Korean with English abstract).
- Lee SJ. 2021. The Impact of COVID-19 on the electricity demand of Korea. Korean Energy Economic Review 20(2):183-206 (in Korean with English abstract).
- Ministry of Health and Welfare (MOHW). 2021 Dec 30. National participation in COVID-19 vaccination throughout the year. Press release.
- Mohideen M, Ramakrishna S, Prabu S, Liu Y. 2021. Advancing green energy solution with the impetus of COVID-19 pandemic. Journal of Energy Chemistry 59(2021):688-705. [https://doi.org/10.1016/j.jechem.2020.12.005]
- Naderipour A, Abdul-Malek Z, Ahmad NA, Kamyab H, Ashokkumar V, Chawalit Ngamcharussrivichai C, Chelliapan S. 2020. Effect of COVID-19 virus on reducing GHG emission and increasing energy generated by renewable energy sources: A brief study in Malaysian context. Environmental Technology & Innovation 20:1-8.
- Park JY, Suh CW. 2015. Analysis of changes in the housing market using TF-IDF weight model. Korea Real Estate Academy Review 63(0):46-58. [https://doi.org/10.1016/j.eti.2020.101151]
- Park NB. 2021. Decomposition analysis of greenhouse gas emissions in the power industry in Korea since the COVID-19 outbreak. Journal of Energy Engineering 30(2):30-42.
- Rita E, Chizoo E, Cyril US. 2021. Sustaining COVID-19 pandemic lockdown era air pollution impact through utilization of more renewable energy resources. Heliyon 7(2021):1-14. [https://doi.org/10.1016/j.heliyon.2021.e07455]
- Roh JS. 2020. The Present and future of Russian oil and gas industry at the crossroad of COVID-19. Asia-Pacific Research Center, Hanyang University. Sino-Soviet Affairs 44(2):217-252 (in Korean with English abstract).
- Son BE, Jeon DI. 2020. Research analysis in quality monitoring of the general education using text network analysis. Korean Journal of General Education 14(5):97-108 (in Korean with English abstract). [https://doi.org/10.46392/kjge.2020.14.5.97]
- 2050 Carbon Neutrality and Green Growth Commission. 2022. Information. Re100; [accessed 2022 November 7].
- World Health Organization (WHO). 2020a. WHO Director-General's remarks at the media briefing on 2019-nCoV on 11 February 2020; [accessed 2022 August 25]. https://www.who.int/director-general/speeches/detail/who-director-general-s-remarks-at-the-media-briefing-on-2019-ncov-on-11-february-2020
- World Health Organization (WHO). 2020b. WHO Director-General's opening remarks at the media briefing on COVID-19-11 March 2020b; [accessed 2022 August 29]. https://www.who.int/director-general/speeches/detail/who-director-general-s-opening-remarks-at-the-media-briefing-on-covid-19---11-march-2020
- Yang SC, Jang JH, Park SY, Ahn SH, Kim SS, Park SB, Ryu BY, Lee SY, Shin EJ, Kim NY, Yoo MS, Lee JG, Kim TY, Kang AR, Kwon DH. 2022. Two-year report of COVID-19 outbreak from January 20, 2020 to January 19, 2022 in the Republic of Korea. Public Health Weekly Report 15(7):414-426 (in Korean with English abstract).
- You ES, Choi GH, Kim SH. 2015. Study on Extraction of keywords using TF-IDF and text structure of novels. The Korean Society Of Computer And Information 20(2):121-129 (in Korean with English abstract).