news

Featured

반도체 제조에서 AI활용을 위한 모델 탐구

2021.11.07

|

 

Series 1. 이미지 분석을 위한 머신러닝

 

아이브이웍스는 에피텍시 기술에 인공지능(AI)을 접목시켜 차별화된 고품질 에피웨이퍼 파운드리 서비스를 제공합니다. 본 연재에서는 반도체 제조와 AI 시리즈를 데이터, 모델, 플랫폼으로 나눠 각 세편에 걸쳐 발행합니다. DOMM AI Epitaxy System 연구에 직접 참여 중인 연구원 시각에서 전하는 화합물 반도체 제조는 어떤 모습일까요.

 


 

인공지능(AI)은 우리 일상에 깊숙이 들어왔습니다. 반도체를 비롯한 다양한 산업 군에서는 인공지능 기술을 도입하여 수치 데이터부터 이미지, 음성 데이터 등 세상에 나오는 모든 데이터들을 모아 서비스를 만들어 내는 데에 주력하고 있습니다. 삶을 윤택하게 만드는 수많은 인공지능 기술 중, 이미지를 활용한 인공지능 알고리즘과 동향을 살펴봅니다.

 

 

이미지 분석을 잘 활용하면…

 

산업에서 흔히 쓰이는 이미지 딥러닝 기술에는 ‘분류(Classification)’, ‘물체 인식(Object Detection)’, ‘의미적 분할(Semantic Segmentation)’ 등이 있습니다. 분류 기술은 기존에 수집해 놓은 다수의 이미지에 라벨(Label)을 부여해 계속 학습시킨 후, 라벨에 따라 새 이미지를 정확하게 분류할 수 있게끔 만듭니다. 앞서 예로 들은 와인은 인공지능이 학습한 이미지 라벨을 기반으로 분류한 정보를 제공한 것입니다.

분류 기술을 활용한 기업으로는 네이버의 ‘스마트렌즈(SmartLens)’가 있습니다. 스마트렌즈는 직접 사진을 찍거나 앨범을 불러오면, 이미지를 인식해 유사한 이미지를 찾아줍니다. 만약, 이미지가 ‘동물’이나 ‘꽃’이라면 백과사전을 통해 품종, 종류 등의 정보를 제공하고, 사람 얼굴 인식을 통해 나이, 표정, 닮은 연예인까지 찾아줍니다.

 

(좌) 네이버 스마트렌즈(SmartLens)를 통한 유사한 이미지 출력, (우) 네이버 스마트렌즈를 통해 출력된 강아지 품종. 같은 사진이지만 영역 설정에 따라 다른 결과가 출력됨을 알 수 있다.

 

물체 인식 기술은 한 장의 이미지 속에서 여러 물체들을 인식하는 기술입니다. 분류 기술과 다른 점은, 한 이미지에 여러 클래스가 있어 ① 이미지 안에서 사물의 위치를 찾고(Bounding Box), ② Bounding Box 안에서 분류 알고리즘이 들어가게 됩니다. 자율 주행 자동차에 쓰이는 알고리즘이 물체 인식 기술의 대표적인 예입니다.

 

자율 주행 자동차 연구분야를 선도하는 ‘엔비디아(ENVIDIA)’는 2019년 12월 ‘GTC 차이나’에서 차세대 자율 주행 플랫폼 ‘엔비디아 드라이브 AGX 오린’을 공개했습니다. 오린은 ISO 26262 ASIL-D와 같은 체계적인 안전 표준을 충족시키면서, 자율 주행 자동차와 로봇에서 동시에 작동하는 수많은 애플리케이션 및 딥 뉴럴 네트워크를 처리하도록 설계됐습니다. 물체 인식 기술로 차선 감지 및 도로 표시, 수직 랜드마크까지 감지해내며, 의미적 분할 기술로 주변 주행 환경을 보다 자세히 인식하여 픽셀 수준 단위로 세분화하여 정밀한 결과를 도출해냅니다.

* 엔비디아 https://blogs.nvidia.co.kr/2019/12/19/orin/

 

(좌) 물체인식 기술, (우) 의미적 분할 기술 예시 ⓒ intel, NVIDIA

 

의미적 분할은 물체인식과 달리, 이미지 라벨링을 픽셀 단위로 하기 때문에 이미지의 경계까지 의미별로 정확하게 구분하는 것이 목적입니다. 사람이 구별하기 힘든 부분까지 세분화하여 분류하기 때문에 의료 이미지(X-ray, CT 등)에서 많이 쓰이는 알고리즘입니다.

 

이와 같은 인공지능 알고리즘으로 분석·예측된 결과는 산업의 장비나 로봇의 자동화가 가능하고, 전보다 훨씬 정밀하고 좋은 결과를 기대할 수 있습니다.

 

산업현장에서 이미지 분석 모델 활용하기

 

이미지 분석 모델은 ‘인공지능’을 세간에 주목받게 만든 일등 공신입니다. 인공지능 모델 중에서도 성능이 우수하고 발전 속도도 빠른 탓에, 연구팀 입장에서도 놀랍긴 마찬가지입니다. 인공지능 알고리즘은 계속해서 쏟아져 나오고, 최신 알고리즘을 실제 구현해 적용해 보는 것이 간단해 보이기까지 합니다.

 

딥러닝 기반의 이미지 분석 모델은 다양한 산업 군에 적용되어, 향상된 결과를 기대해볼 수 있습니다. 하지만, 이미지 분석 모델을 단순하게 적용할 수 있는 산업은 한정적입니다. 산업 현장 속 인공지능 적용은 일반적으로 쓰이는 이미지 딥러닝 기술과는 많이 다릅니다. 때문에, 저희가 중요하게 생각하는 점은 다음과 같습니다.

 

첫째, ‘업무의 이해’입니다. 인공지능 모델은 만능이 아닙니다. 모든 구성원이 업무를 이해하고 도출해내려는 목적이 명확해야 합니다. ‘인공지능이 알아서 해줄 거야’ 라는 인식은 위험합니다. (이런 인식은 어느 기업이든지 매우 위험합니다). 어떤 업무에 대해서 “인공지능 모델이 언제 어디서 어떤 시간 내에 어느 정도의 수준으로 무엇을 찾도록 할 거야”가 명확히 설정돼 있어야 합니다.

 

둘째, ‘데이터’입니다. 어떤 데이터가 있는지, 어떻게 준비할지 명확해야 합니다. 대부분의 산업에서 ‘나는 데이터는 많아’ 라고 생각할테지만, 인공지능에게는 답안지가 없는 문제지일 뿐입니다. 실제 인공지능 모델 적용에 있어서 가장 중요하고 어려운 점이 ‘데이터의 문제’입니다. 온라인이나 학교에서는 이미 공개된 데이터셋을 사용하는 경우가 대부분이므로 데이터의 중요성이 간과될 수 있습니다. ‘업무에 맞는 데이터가 있는가? 있다면 어떻게 수집하고 처리할 것인가?’ 가 준비돼야 합니다. 참고로, 가짜 데이터(fake data)를 만들거나 이미지를 회전 또는 조작하는 어그먼테이션(augmentation)을 하기도 하나 본질적이진 않습니다.

 

셋째, ‘인공지능 알고리즘’입니다. 위의 목표들을 유연하고 빠르게 이룰 수 있는 알고리즘입니다. 인공지능 알고리즘은 많습니다. 특히 이미지 분석에 사용되는 알고리즘도 많고, 연구자들에 의해 점점 성능이 올라가고 있습니다. 자신의 업무에 적합한 모델을 적용하는 것이 중요합니다. 적합한 해상도, 속도, 정확도 등을 고려해 선택하여 튜닝이 진행돼야 합니다.

 

형광스크린에 입사되어 나타나는 이미지 데이터 예시 ⓒ 아이브이웍스 (IVWorks)

아이브이웍스의 ‘인공지능 연구팀’과 ‘에피(Epitaxy) 팀’은 반도체 산업의 높은 이해와 제품 양산에 있어 뚜렷한 목표점이 있습니다.

 

아이브이웍스는 에피웨이퍼(Epiwafer) 생산과정에서 발생하는 RHEED(Reflection High-Energy Electron Diffraction, 전자 빔을 통해 기판(시료) 표면에 입사하여 형광 스크린에 나타나는 이미지)이미지 데이터는, 이미지들의 변화하는 물리적, 화학적 특성들을 가지고 있습니다. 그리고 모든 에피층 성장 구조 데이터들의 ‘수집’, ‘가공’, ‘모델 학습’ 및 ‘예측 모델 실시간 운영’이 가능한 시스템(AI 에피텍시 플랫폼 DOMMTM)에서 다양한 분석이 이루어집니다.

 

분석 작업은 이미지의 분석 알고리즘만 사용할 수는 없습니다. 시계열에 따른 이미지의 시퀀스, 즉, 비디오에 대한 분석도 필수입니다. 이미지 분석을 활용하기 위해서는 다양한 점들이 고려돼야만 합니다. 효과적인 인공지능 모델 적용을 위해, 다음 글에서는 비디오 분석 모델과 여러 모델들을 앙상블한 인공지능모델에 대해 소개하겠습니다.

 

 

 


 

Seul-Lam Kim l Artificial Intelligence team