[녹색시선] 데이터 전공생들과 함께한, 자연보호 AI 개발 경험기

유병혁 논설위원(국립공원공단 사회가치혁신실 과장)
라펜트l기사입력2022-09-13

 

데이터 전공생들과 함께한, 자연보호 AI 개발 경험기




_유병혁 국립공원공단 과장


경험과 지식으로 다른 사람을 지도하고 조언해주는 사람을 멘토(mentor)라고 한다. 필자는 나름대로 학습을 게을리하지는 않았지만, 아직 누군가를 조언할 만한 수준에 이르지 못했다. 지금까지 학습량 대비 산출량으로 짐작해 보건대 아마 평생 그 단계에 도달하지 못 하리라 확신한다. 그래도 괜찮다. 멘토링 수준은 높지 않아도 인생의 만족도는 낮은 수준이 아닐 테니.

그럼에도 3년째 열의를 다해 멘토로 참여하는 프로그램이 있다. 과기부와 KDATA가 주관하고 경남대와 빅리더가 운영하는 ‘빅리더 AI 아카데미’라는 데이터 청년 캠퍼스 프로그램이다. 3년 전, 필자는 이 프로그램에 GIS 분야 강사로 초청받았다. 당시 강의장은 남해바다 끝자락인 통영에 있었고, 도착한 곳에는 전국에서 모인 대학 3,4년생 60여명이 AI를 배우고자 모여 있었다. 서로 대학도 다르고, 전공 역시 개성 넘칠 정도로 다양한 구성이었다.

처음 학생들과 마주했을 때 그 눈빛에서 느껴졌던 끌림을 잊을 수 없다. 한마디로 ‘불타오르네’라는 기분이었다. 나도 모르게 그 뜨거움에 합류했고, 프로젝트 기간에는 나 역시도 새벽을 달렸다. 빅리더 AI 아카데미의 프로그램은 4주간 AI 기술을 집체교육으로 빠르게 익힌 뒤, 남은 4주는 각 기관에 투입되어 현안 해결을 위한 AI 개발 프로젝트를 진행하는 것이다. 필자는 올해도 새로운 빅리더 학생들과 함께 멋진 시간을 보냈다. 이들과 함께한 자연보호 AI 개발 경험기를 요약해 본다.

무더운 여름, 강원도 원주시에 위치한 국립공원공단 본사에 10명의 대학생들이 모여들었다. 서로 다른 대학 소속의 데이터 전공생들은 5명씩 나뉘어 같은 기간에 2종의 자연보호 AI 솔루션을 개발했다. 하루를 한 달처럼, 시간과 열정을 쏟아 부어 이들이 이뤄낸 성과는 정말 놀랍다. T-mirum 팀과 레인저스팀을 각각 소개한다.



T-mirum 팀은 T자형 인재와 라틴어로 '놀라다'라는 뜻인 mirum의 합성어를 뜻한다. 전자공학, 컴퓨터공학, 수학 등 전공자 5명으로 구성된 이 팀은 ‘AI 기반 야생생물 서식지 예측 서비스’를 개발했다. 전국에 광활한 국립공원에 서식하는 야생동물과 이들을 지키는 공단 직원들을 위해 SDM(Species Distribution Modeling, 종 분포 모델링) 프로그램을 자체 제작했다. 그간 공단은 80만 건 이상의 야생동식물 위치 좌표를 현장 조사로 축적해 왔는데, 이들이 개발한 프로그램에 이 좌표들을 넣으면, AI가 서식지를 확률적으로 예측해준다. 프로그램의 이름은 야생생물이 어디에 서식하는지 알아내서 보호 방법을 제시한다는 의미로 “Where Are You, 줄여서 W.A.Y”라고 이름 붙였다.

WAY 프로그램은 그간 SDM 분야에서 많이 쓰던 Maxent 프로그램과 R 프로그래밍 기반의 SSDM 패키지의 장점들을 반영하여 Python 언어로 개발됐다. 현재 6종의 머신러닝 알고리즘이 지원된다. 개발된 프로그램은 UI를 가다듬어 오픈소스로 배포 예정이며 공단 이외에도 경상국립대학교 조경학과, 국립생태원 생태정보팀에서도 테스트를 지원해 주신 상태다. WAY 개발을 통해 그간 일부 직원만 가능하던 서식지 예측 모델링을 누구나 쉽게 시도해볼 수 있게 되었다. 이를 통해 멸종위기종, 기후변화지표종을 비롯한 야생생물들을 보다 과학적으로 보호할 수 있을 것이라는 기대가 크다.










레인저스 팀은 국립공원을 지키는 사람들이라는 뜻을 가진 파크레인저에서 착안하여 팀명을 지었다. 이 팀은 국립공원의 기후변화를 분석하고 예측하기 위한 ‘AI 기반 기후변화 분석 예측 서비스’를 자체 개발했다. 그간 한정된 대수로 운영 중이던 기후변화 관측용 카메라 이미지를 보완하기 위한 데이터로, 이들은 위성 이미지를 채택했다. Terra와 Aqua 위성이 제공하는 2003년부터 2021년까지 7만건이 넘는 데이터를 내려받아 8일 주기의 시계열 데이터를 확보했다. 잎의 성장을 알 수 있는 위성 식생지수를 국립공원별, 산림특성별로 산출하여 데이터를 분석했으며 개엽일을 추출하기 위해 Curve-fitting 알고리즘을, 미래 예측을 위해 2017년 페이스북이 개발한 시계열 예측 모델 Prophet을 적용했다. 프로그램 이름은 생물계절학을 뜻하는 Phenology 분야에 새로운 Paradigm을 제시한다는 의미를 담아 ‘Phenodigm’이라고 지었다.

Phenodigm을 통해 점점 더 빨라지는 개엽일과 식생지수의 최소값 증가, 봄철 기온과 개엽일의 높은 상관관계 등이 분석 결과로 제시되었으며 예측 모델의 정확도는 85%로 나타났다. Phenodigm 제공으로 연구 소요시간은 대폭 감소하였으며 이 프로그램 역시 누구나 활용할 수 있도록 오픈소스로 개방할 예정이다.









한 달이라는 비교적 짧은 시간 동안 이렇게 성과물을 도출하는 것은 결코 쉬운 일이 아니다. 학생분들 이외에도 필자를 포함한 주제 분야의 다수의 멘토분들이 함께 한 ‘집단지성’의 결과다. 이 프로젝트에서 빛나는 부분은 AI가 실제 자연보호에 쓰이는 ‘실용적 연구’를 진행했다는 점이다. 어떻게 하면 현장에서 필요한 자연보호 AI 솔루션을 만들 수 있을까? 필자가 이번에 느낀 부분을 세 가지 요인으로 제시해 본다.

첫째, 데이터 전공자와 도메인 전문가의 충분한 소통이 필수적이다. 조경학자가 도메인 지식을 기반으로 AI를 잘 다룰 수 있으면 이상적이겠지만, 내 지식 분야를 채우기도 시간이 부족한 것이 현실이다. 자신의 도메인 지식에 집중하면서 데이터 전공자들과 소통해서 결과물을 도출하는 것도 하나의 슬기로운 방법이라고 본다. 소통은 다 분야 간 존중을 전제로 하며, 그것이 잘 되었을 때 비로소 제대로 된 협업이 가능하다. 필자는 한 달간 그 과정을 즐겁게 지켜봤다.

둘째, 당연한 얘기지만 실용적 연구를 지향해야만 실용적 결과를 만들 수 있다. 논문만을 위한 연구는 대부분 잡음이 적은 데이터와 단순한 상황을 다룬다. 반면에 실무에서 쌓이는 데이터와 이를 둘러싼 상황은 생각보다 훨씬 더 복잡하게 이리저리 꼬여있다. 꼬인 걸 풀려면, 상황을 제대로 진단함과 동시에 기대 이상의 로직(Logic)을 구현해야 한다. 수학과 통계만으로는 해결되지 않는 별의별 난제들을 경험할 수 있다. 그래서 비슷한 상황을 겪어본 이들의 경험치가 중요하다. 문제 해결을 위해 구글링으로 얻는 지식을 비하하지 말라. 특히 오픈소스로 도움을 얻었다면, 누군가의 지식공유에 반드시 감사함을 표하자. 구글링은 곧 집단지성에 접속하는 방법이다.

셋째, 한정된 시간과 여건에서 모든 것을 이겨내는 힘, 빤하지만 바로 ‘열정’이다. 프로젝트는 여간해서 계획대로 진행되거나 끝나지 않는다. 몸이 아프기도 하고, 주제가 뒤집히기도 하고, 원하는 데이터가 없거나, 어떨 때는 다해놓고 보니 ‘넌 누구냐?’ 싶은 게 나와 있기도 하다. 최악의 상황에서도 절대 잊지 말아야 할 것은, 팀원 모두가 하나의 목표를 향해 열과 성을 다하고 있다는 사실이다. 설령 그렇게 안 보여도 의심하지 말아야 한다. 바뀌는 건 없고 결국 내 페이스만 떨어뜨릴 테니. 감사하게도 우리 공단을 찾아준 학생분들은 끝까지 열정을 유지하고 서로 다독거리며 멋진 여름을 보냈고, 이제 그 결과물은 세상에 나올 준비를 하고 있다. 열정을 과소평가하지 말자.

끝으로 8년째 이 일을 오직 신념으로 이어가고 계신 경남대학교 전종식 교수님과 10명의 대학생 분들, 멘토님들께 감사한 마음을 전한다. 자연보호 AI 역시도 “나보다 우리가 똑똑하다”는 진실 속에서 가능했다. 혼자 잘하던 시대는 끝났다. 이들의 표정을 보며 니체의 명언으로 마무리해본다.



모든 좋은 것들은 웃는다. 어떤 사람이 정말로 자신의 길을 걷고 있는지는 그 걸음걸이를 보면 알 수 있다. 그러므로 내가 걷는 것을 보라. 자신의 목표에 다가가는 자는 춤을 춘다. -니체
글·사진_유병혁 과장 · 국립공원공단
다른기사 보기
bhyu@knps.or.kr

기획특집·연재기사

관련기사