UPDATED. 2024-03-29 14:15 (금)
자율주행차부터 딥페이크까지…컴퓨터 비전의 현주소
자율주행차부터 딥페이크까지…컴퓨터 비전의 현주소
  • 박강수
  • 승인 2020.11.09 14:12
  • 댓글 0
이 기사를 공유합니다

카오스재단 ‘AI 크로스’ 강연 ⑤ 컴퓨터 비전과 딥러닝의 현재와 미래

카오스재단(이사장 이기형)이 인공지능(AI)을 주제로 2020 가을 카오스강연을 펼치고 있다. 지난 7일부터 오는 12월 9일까지 매주 수요일 저녁 8시, 총 10회에 걸쳐 내로라하는 전문가들이 강연을 한다. ‘AI 크로스’를 주제로 의학, 기후, 음악, 수학, 로봇 공학 등 각 학문 분야에서 AI를 어떻게 최첨단으로 활용하고 있는지 살펴본다. 이번 5강에서는 한보형 서울대 교수(전기정보공학부)가 ‘딥러닝을 활용한 컴퓨터 비전의 현재와 미래’에 대해 강연했다.

 

카오스재단 ‘AI 크로스’ 강연 및 연재 순서

1 브레인 3.0 AI와 뇌공학이 바꿀 인류의 미래

2 수학을 통하여 세상을 3차원으로 보는 법

3 게놈데이터를 이용한 정밀의료

4 딥러닝으로 엘니뇨 예측하기

5 컴퓨터 비전과 딥러닝의 현재와 미래

6 AI의 사고과정을 설명할 수 있을까?

7 인간지능을 능가하는 인공지능이 출현할 것인가?

8 바이오메디컬 인공지능

9 헬로 딥러닝: 직관적이고 명확하게 딥러닝을 이해하기

10 음악과 인공지능의 만남

 

인간의 학습법을 모사한 머신러닝

단순한 기계와 특별한 인간

슈퍼인공지능 출현 가능성은?

 

사람의 인지 능력 모방해 ‘보고 이해하는 컴퓨터’
식별하고 개선하고 창조까지, 컴퓨터 비전의 진화
개인정보 침해, 지구온난화 등 딥러닝의 그림자

 

자율주행차의 카메라가 컴퓨터비전으로 환경을 인지하는 장면. =카오스재단
자율주행차의 카메라가 컴퓨터비전으로 환경을 인지하는 장면. 

 

컴퓨터 비전은 ‘기계의 시각’을 뜻한다. 사람이 세상을 보듯 컴퓨터가 물체를 식별하고 이해하도록 하는 기술이다. 인간 모방이라는 과제를 안은 인공지능이 넘어야 하는 가장 중요한 산이다. 관건은 눈과 카메라의 차이가 아닌 뇌와 컴퓨터의 차이다. 시력을 높이는 일보다 말 그대로 ‘지능’을 갖추는 일이 중하다. 컴퓨터가 시각을 갖추기 위해 필요한 것은 데이터를 해석하고 학습하는 시스템이다. 컴퓨터 비전이 기계학습과 만나는 지점이다.

지난 4일 저녁 온라인 생중계된 카오스재단 ‘AI크로스’ 다섯 번째 강연에서 한보형 서울대 교수(전기정보공학부)가 딥러닝을 활용한 컴퓨터 비전 기술의 현주소를 짚었다. 한 교수는 컴퓨터 비전의 명암을 함께 설명했다. 1부에서는 딥러닝 알고리즘 개발과 함께 급격한 도약을 이룬 그간의 성과를, 2부에서는 그럼에도 불구하고 극복하지 못한 기술적 한계, 상용화 과정에서의 사회적, 윤리적 부작용을 다뤘다.

 

지난 4일 한보형 교수가 딥러닝 알고리즘을 활용한 컴퓨터 비전 기술 개발에 대해 강연했다. 사진 = 유튜브 강연 캡처
지난 4일 한보형 교수가 딥러닝 알고리즘을 활용한 컴퓨터 비전 기술 개발에 대해 강연했다. 사진 = 유튜브 강연 캡처

 

더 복잡하고 섬세하게, 인간 따라잡기

‘본다’라고 축약되는 인간의 시각 능력은 다양하게 세분된다. 필요한 사물을 알아보는 일, 풍경을 이루는 요소요소를 식별하는 일, 숫자와 문자 등 기호의 의미를 읽어내는 일, 움직이거나 변화하는 물체를 추적하는 일이 모두 시각의 기능이다. 이는 고스란히 컴퓨터 비전의 과제가 된다. 이미지에서 물체를 검출하고, 픽셀 덩어리를 식별하고, 영상에서는 프레임 단위로 잘린 장면을 이어 ‘운동’을 인지한다. 이 기초적 시각 기능들은 스스로 주변 환경을 살피고 움직이는, 자율 주행 자동차의 기술적 근거가 된다.

한 단계를 높이면 언어와 이미지를 동시에 다루는 일로 이어진다. 이미지를 다루는 딥러닝 신경망과 문자열을 다루는 딥러닝 신경망이 함께 사용되기 때문에 더 정교한 학습 능력이 요구된다. VQA(Visual Question Answering) 기술은 텍스트와 이미지를 동시에 이해하고 답을 제시하는 시스템이다. 예를 들어 코 밑에 바나나를 붙인 사람의 사진이 주어지고 ‘이 사람의 콧수염은 무엇으로 만들어졌나요?’라는 문장을 보여주면 ‘바나나’라는 답을 내놓는 식이다.

VQA 알고리즘의 원리. 텍스트와 사진을 동시에 인지하고 답을 찾는 인공지능.
VQA 알고리즘의 원리. 텍스트와 사진을 동시에 인지하고 답을 찾는 인공지능. 

 

이미지 캡셔닝 기술도 있다. 이미지를 보고 그 내용을 텍스트로 기술해내는 시스템이다. 기계 번역 모델과 유사한데 한 언어를 다른 언어로 옮기는 원리의 앞 자리에 사진을 놓았다는 점이 차이다. 다만 아직 한계가 있다. 한 교수는 “강연을 위해서 우수한 예시를 가져왔으나 아직 어려움이 많다”고 설명한다. VQA의 경우 단편적인 질문들(이것은 무엇인가)에는 곧잘 답을 하지만 가령 시계 사진을 보여주고 ‘지금 몇 시인가?’라고 물으면 답을 못한다고 한다.

인공지능의 꼼수와 오만으로 답이 어긋나기도 한다. 캡셔닝 시스템의 경우 학습 과정에서 보지 못한 생소한 이미지가 주어지면 “하나마나한” 혹은 틀린 캡션을 내놓는다. 홍수가 난 거리에 차들이 잠겨 있는 사진을 보고 “차들이 주차돼 있음”이라고 답하는 식이다. 심지어는 하늘을 나는 자동차 사진에도 같은 결과를 내놓기도 한다. “가장 확률이 높은 기존 학습 자료 중 하나를 골라 찍어버리는 것”이라고 한 교수는 지적한다. “기계가 ‘모르는 것을 모르겠다’고 답할 수 있게 만드는 일”이 무척 어렵다는 것이다. 인공지능은 아직 무지를 배우지 못한 셈이다.

 

인지를 넘어 생성으로, 인간 속여먹기

이미지 학습은 이미지를 생성으로 이어진다. ‘적대적 생성 신경망(GAN, Generative Adversarial Networks)’이 핵심 알고리즘이다. 다량의 이미지를 학습한 생성 신경망(Generator)이 새로운 이미지를 만들어내면 검증 신경망(Discriminator)이 결과물을 평가한다. 가짜인지 진짜인지 판단하는 것이다. 생성 신경망은 검증 신경망을 속이기 위해, 검증 신경망은 가짜 이미지를 검출하기 위해 서로 경쟁하듯 성능을 개선시켜간다. GAN의 가짜 이미지 생성 능력은 이미 사람이 분간하기 힘든 수준까지 왔다.

GAN 알고리즘에 의해 생성된 가짜 이미지들. =카오스재단 제공
GAN 알고리즘에 의해 생성된 가짜 이미지들.

 

생성 기능은 다방면으로 응용된다. 이미지나 영상의 해상도를 개선시켜주고 흑백 사진을 컬러로 만들어주며 영상의 프레임을 채워주기도 한다. 인터폴레이션(Interpolation)이라 불리는 기술은 초당 30개의 장면으로 구성된 영상을 초당 240개의 프레임으로 만들어준다. 재촬영이나 장비교체 없이 영상을 더 정교하게 조작할 수 있다. 그 소름 끼치는 완성도를 보여주는 기술이 잘 알려진 ‘딥페이크(Deepfake)’다. 인공지능을 활용한 가짜 영상 합성 기술로 유명인의 얼굴을 합성해 제작한 딥페이크 포르노는 컴퓨터 비전과 딥러닝의 그림자를 보여주는 사례기도 하다.

딥페이크에서 볼 수 있듯 컴퓨터 비전 기술은 사람의 인지 능력을 교란하는 등 악용의 소지가 커 부작용에 대한 우려도 만만치 않다. 올해 2월에는 물체 식별 알고리즘, ‘YOLO’를 개발한 연구자 조 레드먼이 “컴퓨터 비전 연구를 관두기로 했다”고 선언하며 개인정보 침해와 기술의 군사화를 경고하기도 했다. 한 교수 역시 “학습용 데이터들의 개인 정보 문제, 자율 주행 자동차의 윤리적 판단 문제, 고전력 하드웨어를 요구하는 딥러닝 연구의 에너지 소모와 지구온난화 문제 등 여러 충돌 지점에서 사회적 합의가 필요하다”고 지적했다.

 

딥 러닝 시스템과 에너지 소모에 대한 기사. 하나의 딥 러닝 모델을 작동시킬 때 발생하는 이산화탄소 양은 대략 다섯 대의 차가 평생 배출하는 양과 맞먹는다.
딥 러닝 시스템과 에너지 소모에 대한 기사. 하나의 딥 러닝 모델을 작동시킬 때 발생하는 이산화탄소 양은 대략 다섯 대의 차가 평생 배출하는 양과 맞먹는다. 

 

이 외에도 부정확한 데이터가 오히려 학습을 돕는 ‘과적합’ 문제, 학습용 자료에서 인간의 편견을 학습하는 인공지능 사례 등이 강연에서 다뤄졌다.

 

 

박강수 기자 pps@kyosu.net


관련기사

댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.