정하웅 교수, ″빅데이터, ‘네트워크화’가 핵심″

서울연구원, ‘미래서울 네트워크 포럼’ 개최
라펜트l전지은 기자l기사입력2016-05-01

정하웅 카이스트 물리학과 교수

“정보화시대의 원재료는 ‘데이터’다. 그리고 데이터를 네트워크로 잘 묶어야 현상을 효과적으로 이해할 수 있다”

정하웅 카이스트 교수는 “세상은 수많은 구성요소가 유기적인 협동을 통해 복잡한 현상을 일으킨다”고 말한다. 그는 이를 ‘복잡계 네트워크’라 부른다. 따라서 현상을 이해하기 위해서는 빅데이터 활용이 필수적이며, 네트워크로 묶는 것이 핵심이라고.

서울연구원(원장 김수현)은 지난 28일(목) ‘빅데이터와 도시계획’을 주제로 ‘미래서울 네트워크 포럼’을 개최했다.

이날 포럼에는 정하웅 카이스트 물리학과 교수가 ‘구글 신은 모든 것을 알고 있다: 데이터 과학과 복잡계 네트워크’를 주제로 강연을 펼쳤다.



정 교수는 빅데이터의 정의를 ‘Volume(양), Velocity(속도), Variety(다양성)’ 3V로 설명했다. 특히 데이터는 시간이 지나면 가치가 떨어짐으로 빨리 생성되는 데이터를 실시간으로 분석해야 가치가 있다. 그는 “곧 IoT(사물인터넷) 시대가 도래 하면 다양한 것들이 소통하고, 어마어마한 센서들이 데이터를 쏟아낼 것이며, 데이터들은 점점 복잡해질 것”이라고 말했다.

빅데이터에 대한 쉬운 예로, 구글 검색어 분석이 있다. 사람들은 검색할 때 거짓말을 하지 않기 때문에 검색어의 키워드, 시간, 위치, 이용자의 성별 등을 추출하고, 정확도를 높이기 위해 연관검색어를 분석한다면 트렌드를 파악하고 미래를 예측해볼 수 있다는 것이다. 실제로 구글은 검색어 통계를 통해 미국 질병통제예방센터(CDC)보다 2주나 빠르게 독감환자수를 실시간으로 예측해내기도 했다.

정 교수는 이러한 빅데이터 분석을 도시의 시설배치에 적용해보았다. 1차적으로 고려되어야 할 ‘인구밀도’의 분석만으로는 시설배치가 어렵다. 공공시설과 상업시설은 그 성격이 다르며, 각 시설마다 요구도가 다르기 때문이다. 그러나 각 도시들의 데이터를 분석, 활용한다면 각 시설마다의 패턴이 발생한다고 한다. 예를 들면 일정 기준의 인구밀도를 1로 볼 경우, 은행은 1.2개 필요하고, 소방서의 경우는 0.6개가 필요하다는 패턴이 도출된다는 것이다.

도로망에 적용할 경우는 더욱 복잡하다. 직관적으로 교통체증을 완화하기 위해 도로를 확장하고, 다리를 건설하는 방안을 마련할 수 있지만, 실제로 분석해보면 오히려 교통체증을 더욱 악화시키는 경우가 발생하기도 한다고. 실제로 카이스트 연구팀은 보스턴과 뉴욕의 도로망을 분석한 결과, 오히려 존재하지 않는 것이 나은 도로를 걸러내기도 했다.

정 교수는 “복잡계에서는 예측하지 못한 사이드 이펙트가 있을 수 있기 때문에 1차적인 생각을 버리고 시스템적 사고로 큰 그림을 보는 것이 필요하다”고 말했다.


정회윤 서울연구원 박사,손기민 중앙대 사회기반시스템공학부 교수

토론에서는 빅데이터를 공공부문에서 활용하는 방안에 대해 논의가 이루어졌다.

손기민 중앙대 사회기반시스템공학부 교수는 “도시계획과 교통계획은 공공부문의 몫이나, 교통량의 경우 민간에서 자료를 구입하고 있는 실정”이라며 공공에서는 민간이 관심을 갖지는 않으나 사회적 효용이 큰 토지이용, 지가, 에너지 사용량 등의 자료를 집중 수집 관리하는 정책방향을 설정해야 할 것이라고 의견을 제시했다.

아울러 정부 3.0 정책에서 가장 힘든 부분이 ‘자료공개’라면서 “정형화된 자료에 대한 무결성을 확보하는 것이 가장 중요하다”고 덧붙였다.

정회윤 서울연구원 박사는 “방대한 양의 데이터가 쏟아지고 있기 때문에 올바른 문제제기가 우선되어야 필요한 자료를 추출할 수 있을 것”이라고 말했다.



글·사진 _ 전지은 기자  ·  라펜트
다른기사 보기
jj870904@nate.com

네티즌 공감 (0)

의견쓰기

가장많이본뉴스최근주요뉴스

  • 전체
  • 종합일반
  • 동정일정
  • 교육문화예술

인기통합정보

  • 기획연재
  • 설계공모프로젝트
  • 인터뷰취재