얼굴인식 AI 성능을 높이는 데이터 구축 트렌드

알체라

알체라

2023년 2월 13일 (월)

얼굴인식 AI 기술의 성능을 높이는 가장 이상적인 방법은 전 세계인의 얼굴 데이터를 학습하는 것입니다. 간단하지만 현실적으로 불가능한 방법이죠. 일반적으로 얼굴인식 AI 학습에 필요한 데이터는 이미지 제공자를 모집하여 초상권에 대한 일정 비용을 지불한 후 수집합니다. 혹은 초상권에서 자유로운 인물, 셀럽이나 정치인 등의 이미지를 온라인상에서 수집하여 활용하기도 합니다. 하지만 점차 개인정보에 대한 사람들의 인식과 규제가 강화되면서 공개 데이터셋이 폐쇄되고, 일반적인 방법에도 한계가 생기게 되었습니다.
이에 대응할 수 있는 대안으로 GAN(Generative Adversarial Networks)이 떠오르고 있습니다. 오늘은 고성능 얼굴인식 AI를 위한 데이터 구축 방식 중 GAN을 중심으로 알아보겠습니다.

 

데이터 학습의 트렌드, GAN

GAN(Generative Adversarial Networks)은 우리나라 말로 번역할 경우 ‘적대적 생성 신경망’이라고 불리는 AI 기술로, 실제와 같은 이미지를 만들 수 있는 프로그램입니다.
아래 이미지는 실존하는 사람의 사진이 아닌, GAN을 통해 생성한 데이터 예시입니다. 실존 인물처럼 보이는 것을 넘어 각기 다른 표정, 노화로 인한 변화, 헤어스타일, 안경, 액세서리 착용 유무 등 다양하게 변형할 수 있습니다.

‘적대적’이라는 말에서 알 수 있듯이 GAN은 서로 다른 네트워크에서 적대적으로 학습시키며 실제 데이터와 반대되는, 한 마디로 ‘가짜 데이터’를 만들어 내는 모델입니다. 더욱 정확하게는 ‘가짜’라고 하기엔 정말 ‘진짜’ 같은 데이터를 의미합니다.

GAN의 개발자 * Ian Goodfellow는 GAN을 경찰과 위조지폐범을 예시로 들어 설명했습니다.
위조지폐범의 목표는 최대한 진짜와 같은 위조지폐를 만들어 완벽히 경찰을 속이는 것입니다. 또한 경찰은 진짜 지폐와 위조지폐를 판별하여 범죄자를 검거하는 것을 목표로 합니다. 
이 둘은 서로를 속이고, 속이지 않기 위해 각각의 노력을 하게 되는데, 먼저 위조지폐범은 경찰을 속이지 못한 지폐를 골라 학습하고 경찰은 속아 넘어간 위조지폐를 모아 분석할 것입니다.

* Ian Goodfellow: GAN의 개발자로 미국의 컴퓨터 과학자이자 엔지니어(Google Brain 연구자이자 Apple 기계 학습 책임자로 근무했던 이력이 있음.)

 
여기서 위조지폐범은 진짜와 유사한 가짜 데이터를 만드는 ‘생성모델’이 되고, 경찰은 진짜와 가짜를 구별하는 ‘분류모델’입니다.

 


먼저, 분류모델(경찰)에 진짜와 가짜 데이터를 입력하여 분류할 수 있도록 학습하는 과정이 선행되어야 합니다. 

 

분류모델(경찰)이 진짜와 가짜 데이터를 분류할 수 있게 되면, 그 후 생성모델(위조지폐범)에서 생성한 가짜 데이터와 진짜 데이터를 분류할 수 있도록 학습합니다.

 

이렇게 분류모델(경찰)의 2단계 학습이 완료되면, 생성모델(위조지폐범)을 분류모델(경찰)을 속이는 방향으로 학습시킵니다. 생성모델(위조지폐범)이 생성하는 가짜 데이터가 진짜로 분류될 만큼 완벽한 데이터를 만들 수 있도록 고도화시키는 것입니다. 이 과정을 두 네트워크가 서로를 경쟁자로 의식하는 ‘적대적 학습’이라고 하며, 결과적으로 생성모델(위조지폐범)은 진짜와 완벽히 유사한 가짜를 만들 수 있게 되고, 분류모델(경찰)은 진짜와 가짜를 구별할 수 없게 됩니다.

현재까지 AI 기술 혁신은 지도학습으로 이루어졌습니다. 하지만 많은 전문가들은 AI의 미래는 비지도학습이라는 전망을 예상하고 있습니다. 개발자가 직접 데이터에 대한 정답을 입력하지 않아도 되며, 리소스의 한계를 극복한다는 점에서 GAN과 같은 프로그램은 얼굴인식뿐만 아니라 AI 기술 발전에 좋은 방향성이 될 수 있을 것입니다. 

 

알체라의 데이터 구축 방법 및 기술 성능을 향상시키기 위한 노력 

알체라는 GAN을 통해 생성된 이미지 기반으로 학습 및 테스트에 활용 중이며 Diffusion model 등 다른 형태의 생성 모델 적용 또한 검토하여 얼굴인식에서 개인정보 이슈를 점진적으로 제거하는 것을 목표로 하고 있습니다.

노화, 헤어스타일, 안경 착용 등을 고려하여 다양한 데이터를 생성하고 얼굴뿐만 아니라 행동 데이터 역시 GAN 모델을 통해 제작 가능합니다. 

알체라의 데이터 구축 차별점 

얼굴인식 AI는 빠르고 정확한 인식 성능은 물론 다양한 실제 환경 조건을 대응할 수 있어야 합니다. 알체라는 그림자, 강한 조명, 역광 등 다양한 환경에서도 99% 이상의 정확도, 1초 이내의 인식 속도를 구현하기 위해 지속적으로 새로운 환경에 자사 기술을 적용해보며 성능 개선을 이루고 있습니다. 만약 적용되지 않는 분야가 있다면 자체 데이터 센터를 통해 빠르게 데이터를 생성, 구축하고 반복적인 학습을 통해 극복해 나가는 방식입니다. 
알체라는 자체 데이터 센터를 통해 얼굴인식 AI 학습에 필요한 대규모 DB를 구축하여 하루 수 만장 이상의 데이터를 생성하며 수집, 가공, 학습, 엔진 개발까지 모든 과정을 내재화하고 있습니다. 

 

알체라의 또 다른 경쟁력, 위변조 판별  AI 

알체라의 얼굴인식 AI 기술의 차별점은 단연 위변조 판별 기술을 보유하고 있다는 점입니다. 위변조 판별 기술이란, 실제 얼굴이 아닌 위변조된 이미지를 판별하는 기술을 의미합니다. 해당 기술은 알체라가 보유한 다양한 금융권 레퍼런스에서 활용되고 있는데, 비대면 상으로 본인인증을 진행할 경우 신분증과 실제 얼굴을 비교하여 신원확인이 가능합니다. 

위변조 판별 기술을 위해서는 위변조된 데이터 학습이 필요합니다. 다양한 질감의 2D 사진, 3D 입체 가면, Display를 통해 발현되는 이미지 등 위변조 이미지 데이터의 종류와 형태는 각양각색입니다. 
다양한 변수와 조건을 충족하는 데이터가 해당 기술의 관건이라고 할 수 있습니다. 이 역시 알체라의 자체 데이터 센터에서 직접 데이터를 제작하여 학습에 활용하고 있으며, RGB, 3D depth, IR 등 여러 하드웨어에서 위조판별이 가능하여 어떤 환경에서든 적용할 수 있습니다.

알체라의 얼굴인식 AI 기술은 금융권을 넘어 다양한 산업군에 적용되고 있습니다. 우리의 삶과 사회전반에서 모두의 안전을 지키는 기술이 될 수 있도록 계속해서 성능 향상에 노력을 다할 것입니다. 
 

...

...