news

Blog Post

AI-Agents가 바꾸는 소재 생태계 2: 실험실을 넘어 양산으로

2025.08.06

|

에디터 주 : 해당 포스팅은 총 세 편으로 기획된 ‘AI-Agents가 바꾸는 소재 생태계’ 시리즈의 두 번째 글입니다. 지난 글에서는 AI-Agents에 대한 간단한 이해와 반도체 소재 기업에서 에이전트를 빌딩 하려는 이유를 알아봤습니다. 두 번째 글에서는 에피 제조 관점에서 에이전트를 살펴보고 어떻게 이를 적용시켜 나가고 있는지 살펴보려 합니다. 이번 시리즈는 기술적 내용보다 인사이트 관점을 강조하여, 향후 실제 기술 칼럼을 접했을 때 여러분의 이해를 높이기 위한 예고편과 같습니다. 궁금한 내용은 댓글 달아주시고 아이브이웍스의 AI 연구에도 많은 기대와 응원 바랍니다!

 

전통적인 에피 방식과 한계점

 

질화갈륨 반도체 수급에 가장 중요한 공정으로 꼽히는 ‘에피택셜 성장(Epitaxial Growth)’

기판 위에 아주 얇은 층을 ‘원자’ 단위로 층층이 쌓는 이 과정은 매우 까다롭고 민감한 공정이다. 고온·고진공 환경에서 일어나는 물리적 반응을 나노 단위로 아주 정밀하게 제어해야 하기 때문인데. 이렇게 복잡한 공정을 함에 있어서, 지금까지 이어지고 있는 전통적인 에피 성장 방식에는 몇가지 한계점이 발견된다. 이는 공정 방식의 오류라기보다는, 대량 생산 체제에 접어들었을 때 발생할 수 있는 상업적 한계로 볼 수 있다.

 

 

품질 개선 사이클이 느리다

◇ 반복되는 성장 조건 최적화

에피택시는 병렬적 실험이 어려운 구조다. 통상적으로 성장 → 조건 수정 → 재 성장을 반복하는 형태를 갖는다. 성장된 웨이퍼의 측정 결과가 목표에 미치지 못하면 조건(Flux, 온도, 도핑 농도, 성장 속도 등)을 수정해서 다시 성장을 한다. 이 사이클을 수차례 반복해서 최종적으로 원하는 에피 구조에 도달하게 하는 게 연구, 산업 현장에서 오랜 시간 사용되어오고 있는 방식이다.

 

얼핏 보면, 불량 가능성 있는 웨이퍼를 다 성장될 때까지 기다리는 방식은 비효율적으로 보일 수 있다. 에피는 사용 방식(MBE, MOCVD, HVPE 등)에 따라 차이가 있으나 일반적으로 밀폐된 환경에서 이뤄진다. 수시로 꺼내 육안으로 확인해 보기도 어렵고, 장비 구조 상 다양한 조건을 동시에 실험할 수도 없어서, 각 조건을 정밀하게 조정하며 반복적으로 검증하는 이 방식이 가장 효과적인 것이다.

 

그러나, 이런 점 때문에 개선 사이클이 매우 느리고 공정 최적화 또한 엔지니어의 경험과 직관에 의존하는 경향이 크다. 성장 중 일부 정보를 실시간으로 확인할 수 있는 방법들(RHEED, Reflectometry, Pyrometer 등)이 있긴 하지만, 이 시그널을 읽고 판단하는 건 여전히 사람의 몫이다. 시그널의 변화가 이상 징후인지, 또는 정상 범주 내의 변화인지를 판단하는데 사람의 주관이 들어가기 때문이다. 그래서 같은 데이터를 두고 사람마다 해석이 다를 수도 있고, 때로 중요한 신호를 놓치기도 한다. 이는 결국, 공정 중에는 실시간 오류 감지가 어렵고, 대부분의 경우 공정이 완료된 후에 조건 설정에 문제가 있었음을 인지할 수 있다는 한계로 이어진다.

 

◇ 사이클 반복으로 누적되는 실험 비용

이처럼 공정 구조 상 병렬 실험이 어렵고, 사람의 지속적인 모니터링이 요구되기 때문에, 한 번의 실험에 소요되는 시간과 자원은 매우 크다. 런 준비, 조건 설정, 공정, 후처리, 분석까지 전 과정을 포함하면, 하나의 사이클에 최소 수 시간에서 수십 시간이 걸린. 반복 횟수가 늘어날수록 시간과 비용 부담은 누적된다. 실제 양산 환경에서는 이러한 환경을 무한히 반복하는 것이 어렵다. 결과적으로 생산에 제약이 따른다.

 

 

재현성과 일관성을 동시에 만족시키기 어렵다

◇ 반복되는 성장 조건 최적화

에피 공정의 또 다른 특징은 변수가 많고, 이 변수들이 비선형적으로 얽혀 있다는 점이다. 때문에 정확한 조건을 사전에 계산해 내기 어렵다. 이 조건들은 대개 숙련자의 경험과 과거 데이터를 바탕으로 설정한다. 그러나, 똑같은 조건이어도 장비 상태나 환경 변화 등으로 예전과 동일한 결과가 재현되지 않을 수 있다. 이처럼 불확실성과 복잡도가 있는 상황에서는 전통적인 실험 방식만으로 최적의 조건을 안정적으로 찾아내기 어렵다. 양산 환경에서는 공정 조건의 재현성과 일관성 역시 중요한데, 소규모 실험 단계에서는 일정 품질을 구현할 수 있지만, 동일한 결과를 양산 환경에서 안정적으로 재현하기란 훨씬 더 까다로운 과제다.

 

 

 

우리는 왜 한계점을 개선해야 할까?

 

화합물 반도체 산업은 아직 성숙기에 도달하지 않은 시장이다. 실리콘 기반 반도체와 달리 GaN, InP 같은 화합물 반도체는 상용화 역사가 짧고, 기술과 생태계가 빠르게 진화하는 단계에 있다. 이는 곧 기술적 우위를 선점한 기업이 장기적으로 시장을 주도할 가능성이 크다는 의미와 같다.

 

그러나, ‘품질’만으로는 충분하지 않다.

일정 수준 이상의 품질 확보는 이미 시장에서 당연히 요구되는 기본 조건이다. 고객들은 품질은 유지한 채, 더 짧은 리드타임으로, 더 다양한 맞춤형 사양을 공급할 수 있는 유연성이 있는 파트너를 선호한다. 화합물 반도체는 조성의 까다로움과 공정의 복잡성 때문에 한 번의 실험, 한 번의 생산에서 최대 성과를 내야 하는 압박이 크다. 시장 트렌드는 빠르게 변하고, 개발 속도 자체가 경쟁력으로 평가되고 있는 지금. 이 변화의 환경에서 비효율을 줄이지 못하면 곧 경쟁에서 밀려날 수밖에 없다.

 

문제는 전통적인 생산 방식만으로는 이 요구를 감당하기 어렵다는 점이다.

제조 환경에서 ‘비용’과 ‘시간’은 매우 중요하다. 앞서 본 것처럼 공정 조건을 하나하나 실험하며 최적화하는 기존의 접근법은 시간과 비용 부담이 크고, 결과적으로 신속한 대응과 안정적인 품질 유지가 어렵다. 또한 수십 개 변수의 복잡한 상호작용을 엔지니어의 경험만으로 예측하거나 재현하기에는 한계가 뚜렷하다. 이는 시장 요구와 정면으로 충돌하는 요소이다.

 

그래서 아이브이웍스는 에피 공정의 자동화와 지능화를 통한 혁신으로 기술적 우위를 선점하고자 한다.

AI가 단순히 사람의 작업을 대체하는 수준을 넘어서, 데이터를 기반으로 신뢰성 있게 공정을 분석하고, 잠재적인 문제를 사전에 예측하며, 변수 간 상관관계를 학습해 최적의 에피 생산 조건을 제안·수정할 수 있는 체계가 필요하다. 아이브이웍스가 선도한 이 AI 기반 에피 공정 혁신은 이제 후발 기업들이 주목할 정도로 확산되고 있다. 아이브이웍스의 자동화는 업무의 효율화를 위한 것이 아니다. 아직 산업 표준과 시장 주도권이 명확히 정립되지 않은 GaN 시장에서 리딩 컴퍼니의 위치를 다지기 위한 기술적 인프라로서의 의미를 가진다.

 

앞서 살펴본 한계점을 돌아보면 자연스럽게 다음과 같은 질문이 떠오릅니다.

 

‘개선 사이클 주기를 더 빠르게 할 방법은 없을까?’

‘조건을 수정할 필요 없게 처음부터 양질의 에피를 성장해 낼 순 없을까?’

‘생산성을 더 높일 수 있는 방법은 없을까?’

만약 엔지니어가 계속 장비를 지키고 있지 않아도 된다면? 판단 실수가 줄어든다면? 최적의 성장 조건을 사전에 계산해낼 수 있다면?’

 

이런 아이디어들이 현실화된다면 에피 공정이 가진 본래의 구조적 제약을 해결해 나갈 수 있습니다.

 

 

ⓒ 아이브이웍스 (IVWorks)

 

AI-Agents로 바꾼 에피 생산성 최적화 사례

 

지난 글에서 아이브이웍스의 AI 에이전트는 에피 성장에 필요한 다양한 자동화 요소들을 통합·확장시킨 개념이라고 했다. 오늘은 그중 하나인 ‘MRA(MBE Run Automation)’를 살펴보려 한다. MRA는 지난해 AI 엔지니어와 에피 엔지니어들로 구성된 TF를 통해 기획된 프로젝트로, 최근 실제 생산 라인에 적용되기 시작했다. 이 프로젝트는 말 그대로 ‘런 자동화’, 즉 AI가 에피 공정을 자율적으로 MBE 공정을 운용해 내는 무인 자율 생산 시스템을 뜻한다.

 

핵심은 ‘사람의 부재’다.

엔지니어가 현장에 없어도 에피 공정이 스스로 진행되는 것. 좀 더 구체적으로 알아보자.

 

에피 공정에는 사람이 필요하다

◇ 공정 리스크를 막기 위한 즉각적 판단과 개입

고품질 에피웨이퍼를 생산하려면, 로딩부터 진공, 런 레디, 성장, 냉각에 이르는 여러 단계에서 일어나는 변수들을 적시에 조정해 주어야 한다. 과거에는 각 단계마다 작업자가 직접 ‘실행’ 버튼을 눌러줘야 했지만, 지금은 시퀀스를 짜서 알아서 단계가 돌아가도록 소프트웨어가 내장되어 있다. 하지만 이는 어디까지나 기계적 흐름에 따라 동작할 뿐, 실제 가동 중 발생하는 물리적 문제나 시스템 이상에는 대응하지 못한다. 예기치 못한 진공 상태 변화, 기계 오작동, 온도차 변화처럼 실시간 판단과 조치가 필요한 상황이 생기면 결국 사람이 개입해야 한다. 그래서 에피 공정이 진행되는 동안에는 반드시 엔지니어가 옆에 있어야만 했다.

 

한 예로 ‘웨이퍼 로딩 이슈’를 보자.

에피 공정의 첫 단계는 웨이퍼가 실린 홀더를 로딩 챔버에 장착하는 일이다. MBE는 여러 개의 챔버가 연결된 구조로 로봇 암(robot arm)이 이 사이를 다니면서 홀더를 옮긴다. 이때, 만약 홀더가 비뚤게 장착됐다면 어떨까? 이동 중 홀더가 내부 구조물과 충돌하거나, 웨이퍼가 기울어져 파손될 수 있다.

 

 

로딩 챔버에 장착되는 웨이퍼 홀더. 에피 공정은 초고진공 상태에서 진행되기 때문에, 장비 가동 중에는 챔버를 쉽게 열거나 내부에 손을 넣어 조정할 수 없다. ⓒ 아이브이웍스 (IVWorks)

 

로딩 오류는 다양한 원인으로 발생할 수 있다. 웨이퍼의 오염, 홀더 마모, 좌표의 오차, 장비 내부 온도차나 진동 같은 시스템적 요인은 물론, 초기 세팅이나 물리적 문제에서도 비롯될 수 있다. 이러한 로딩 이슈는 조성 불균형, 결정 결함, 성장 실패 등으로 이어져 양품 생산을 어렵게 만든다.

 

게다가 시스템 차원의 손실도 크다. 예를 들어 홀더가 챔버 내부에 떨어질 경우, 수 시간에 걸쳐 형성한 진공을 깨고 수습 작업을 해야 한다. 소스를 재증착해야 하고, 전체 일정이 일주일 이상 지연되기도 한다. 소스 비용을 넘어, 생산 차질로 인한 간접 손실도 발생하는 셈이다. 이런 위험들에 대비하기 위해, 작업자는 런이 진행되는 내내 장비 상태를 모니터링하고 이상 징후에 신속히 대응해왔다.

 

이는 단순히 로딩 단계에만 국한된 이야기가 아니다.​

박막 성장 단계에서도 다양한 변수에 대한 실시간 대응이 필수다. 예를 들어, 성장 조건의 유지와 보정, RHEED 패턴을 통한 결정 상태 감지, 진공계 경고 발생 시 공정 중단 여부 판단, 셀 온도 안정화 등이 있다. 이러한 판단과 조정은 모두 빠르고 정확한 대응을 요구하기 때문에, 기존의 에피 성장 방식에서는 엔지니어가 현장을 떠날 수 없었다.

 

◇ MRA를 이용하면?

아래 사진은 웨이퍼가 장착된 홀더가 챔버에 로딩되는 모습이다. MRA는 웨이퍼와 홀더의 움직임을 실시간으로 분석해 이상 예측 스코어를 산정해낸다. 이는 평소 정상적인 상태에 비해 얼마나 다른지를 수치화 한 것이다. AI 모델은 과거 공정 데이터와 장비의 동작 패턴을 학습해, 실시간 장비의 움직임을 비교·분석하고 정상 범주를 벗어날 경우 이를 즉시 감지해낸다. (아래 우측 abnormal 상태)

 

 

ⓒ 아이브이웍스 (IVWorks)

 

이 경우 MRA는 자체 판단으로 task를 중지하는 조치를 취한다. 혹은 상황에 따라 작업자에게 선택지를 주면서 새로운 task를 요청하기도 한다. 공정 과정에서 발생한 모든 히스토리는 작업자에게 메시지 형태로 공유된다. 여기에는 실시간 공정 영상과 MRA가 감지한 위험 요소에 대한 원인과 대응 내용이 담겨 있다. 그래서 엔지니어는 장비 옆에서 공정 상태를 지켜보지 않아도 로딩 과정을 실시간으로 확인할 수 있고, 공정 상태에 대한 정보를 빠짐없이 파악할 수 있다.

 

 

로딩 작업이 자동으로 시작되었음과 성공적으로 종료되었음을 알려주는 MRA의 메시지(좌측)과 상세 히스토리 내역(우측) ⓒ 아이브이웍스 (IVWorks)

 

특히 MRA는 작업자들이 모두 퇴근한 야간이나 주말에도 동일하게​ 작동한다.

로딩을 포함한 공정 단위 작업들은 스케줄 설정을 통해 자동 실행할 수 있으며, 작업자는 각 작업의 순서와 일정을 조합해 필요한 작업을 미리 지시해 둘 수 있다. 이로 인해, 전통적인 방식에서는 작업자의 근로 시간에 맞춰야 했던 공정 시간을 사람이 없는 시간에도 안정적으로 운영할 수 있게 되었고, 이는 생산성 향상에 크게 기여하는 요소이다. 이 방식은 현재 아이브이웍스 팹에 실제로 적용되어 활발히 운영되고 있다.

 

양산과 판매가 목표인 ‘파운드리’에서 생산성은 매우 중요한 요소이다. 기업은 한정된 업무 시간 내에 의미 있는 런을 많이 돌려야 한다. 이런 상황에서 MRA는 일관된 품질의 작업 결과를 확보하면서도, 한정된 업무 시간 안에 더 많은 고품질 제품을 생산하도록 돕는다.

 

단편 사례를 들어 소개했지만, MRA는 전체 공정에 걸쳐 마치 숙련된 엔지니어가 24시간 현장을 지켜보듯이 작동한다. 각 단계에서 발생하는 이상 징후를 실시간으로 탐지하고, 상황에 따라 적절한 판단과 조치를 취하며, 필요한 경우 작업자에게 콜을 보내거나 선택지를 제시하는 등 의사결정까지 수행할 수 있다. 이는 단순한 자동화의 차원을 넘어, 판단하고 대응하는 ‘자율 공정’​에 가까운 변화다.

 

오늘은 전통적인 에피 방식의 한계와 양산 시점에서 이를 개선하기 위한 MRA의 단편적인 활용 사례를 살펴보았다. 다음 시리즈에서는 앞서 살펴본 ‘전통적인 에피 방식의 한계점’에서 도출된 아이디어들에 대해, 현재 아이브이웍스가 어떤 방식으로 이를 개선해 나가고 있는지 구체적으로 살펴보겠다.

 


 

Yoon-Seo Cho l Marketing Manager at IVWorks

※ 본 칼럼은 기고자의 주관적인 견해로, 아이브이웍스 공식 입장과 다를 수 있습니다.