거대한 LLM을 손안의 디바이스에 담을 동료를 찾습니다 – FD 모델 최적화팀

마키나락스에는 거대한 LLM을 우리 손안의 기기 안으로 넣으려는 일에 도전하는 팀이 있습니다. 바로 모델 최적화팀인데요. 학습은 GPU에서 이뤄지지만 실제 사용은 GPU가 없는 환경에서 이뤄져야 한다는, 언뜻 모순처럼 보이는 과제를 매일 마주하는 팀이죠. 정해진 하드웨어의 한계를 극복해 성능을 만들어 내는 모델 최적화팀의 이야기를 FDE 김승주님과 김태호님에게 들어보았습니다.

Q. FD 모델 최적화팀이 하는 일을 소개해 주세요

승주: 한마디로 정리하면 ‘온디바이스(On-device) AI를 탑재하는 일’을 하고 있습니다. 예를 들어 핸드폰에는 NPU라는 별도의 하드웨어가 들어가는데, 같은 NPU라고 해도 동작 방식이 제각각입니다. 그래서 GPU에서 학습된 거대한 모델을 모바일 NPU의 특성에 맞게 변환해서 그 안에서 잘 동작하게 만드는 것이 저희가 목표로 하고 있는 일들입니다.

태호: ‘마키나락스의 고객사와 함께하는 프로젝트를 기반으로 고객 만족을 위해 노력하는 팀’이기도 해요. 세상에는 많은 하드웨어 제품이 있는데, 그 안에 어떻게 LLM이 최적화돼서 사용자가 잘 이용할 수 있을까에 대한 고민과 탐구를 우리 팀은 하고 있고 실제로 다양한 과제를 통해 도전해보고 있습니다. 어렵지만 재밌어요.(웃음)

Q. 아직은 생소한 개념들인 것 같은데, 팀에서는 구체적으로 어떤 일을 하고 있나요?

승주 : 주로 하는 일은 크게 세 가지로 나눌 수 있어요. 첫째는 변환입니다. LLM이 NPU 위에서 동작할 수 있도록 모델을 바꾸는 작업이죠. 둘째는 양자화예요. 양자화는 연속적인 정보를 불연속적인 데이터로 효율적으로 압축해 저장하는 방식인데, NPU에서는 사실상 양자화가 필수입니다. 모델 성능은 최대한 유지하면서도 더 빠르고 효율적으로 돌아가게 만드는 거죠.

셋째는 공정 표준화와 툴 개발입니다. 오픈소스 LLM을 기기에 탑재하기까지는 여러 공정이 있는데, 단순히 변환 결과물만 넘기는 게 아니라 그 과정을 검증하고 누구나 동일한 형상으로 작업할 수 있도록 SDK와 툴을 만들고 있어요. 여러 고객사,파트와 협업하면서 표준화된 인터페이스를 구축하는 작업입니다.

태호 : 승주님이 너무 잘 설명해 주셨는데요. 덧붙이면 그래프 설계도 담당하고 있어요. 모델 안에는 결국 수많은 수학 연산이 들어 있습니다. 행렬 곱이 있고 덧셈이 있고… 그 연산들을 순서대로 쭉 이어 붙인 것이 ‘그래프’예요. 저는 이 그래프를 편집하거나, 특정 부분에 양자화를 적용하면서 NPU가 가진 제약을 만족시키는 역할을 합니다. 예를 들어 극단적으로 덧셈이 안 되는 하드웨어가 있다고 하면 그 한계를 극복하고 어떻게든 똑같이 동작하게 만들어야 하는 거죠.

마키나락스 FD 모델 최적화팀

Q. 흥미롭네요. 모델 최적화팀에는 어떤 분들이 모여 시너지를 내고 있는지도 궁금합니다.

승주: 한마디로 탐구심이 강한 사람들이 모여 있어요. ‘이게 왜 이럴까’를 끝까지 파고드는 성향이죠. 그리고 또 하나의 큰 시너지라고 한다면 화목하다는 거예요. 문제점을 이야기할 때 눈치를 주는 분위기가 전혀 없습니다. 오히려 ‘왜 이렇게 하는지’를 두고 부딪히는 과정이 팀의 합의를 더 좋게 만든다고 생각해요.

비슷한 사람끼리만 모인 것보다 다양한 능력을 가진 사람들이 한 팀으로 뭉칠 때 더 큰 시너지가 난다고 믿고요. 각자가 경험해 온 분야에서 강점이 분명한 사람들이 모여 있습니다.

태호: 저도 승주님 의견에 동의해요. 다들 ‘일에 몰입하는 사람’이라 협업이 편합니다. 말만 해도 서로 알아듣고 원하는 결과물을 얻어낼 수 있어요. 문제를 파고드는 집요함도 있고요. 데일리 회의를 할 때도 굉장히 캐주얼하게 진행돼요. ‘오늘 뭐 할지’ 정도 업무를 조율하고 필요에 따라선 과감하게 생략하기도 합니다.

Q. 본인의 분야에 몰입하는 사람들이 모인 모델 최적화팀이군요. 팀에서는 어떤 기술을 주로 활용하나요?

공통: 기술이라기보단 주로 활용하고 있는 도구들을 소개해 드릴게요. 저희는 모델을 탑재하기 위해 변환하고 최적화하는 일에 집중하니까요. 그래서 내부적으로도 특정 기술 스택을 맞추기보다는 우리에게 주어진 문제들을 함께 도전하며 잘 배울 수 있는 분이면 좋을 것 같아요.

최신 LLM 구조 이해를 위한 도구 (Hugging Face): 저희가 모델 구조를 직접 바꾸기도 하기 때문에, 구조를 알아야 어떻게 바꿀지 알 수 있어요.
양자화 이해를 위한 도구 (오픈소스 라이브러리 AIMET)
PyTorch: AI를 쉽게 만들고, 학습할 수 있는 대표적인 오픈소스 라이브러리

Q. 한창 채용이 진행 중인데요. 미래의 동료에게 기대하는 역량과 태도는 무엇인가요?

승주: 탐구에 대한 깊이와 열정이 있는 분이요. 예를 들어 파이썬으로 실험 코드를 작성해 본 경험이 있으면 좋습니다. 중요한 건 언어 자체가 아니라 자기가 생각한 실험을 코드로 구현해 낼 수 있느냐예요. 결국 문제 해결에 대한 고민을 깊이 해보신 분이 우리 팀에 제격인 것 같습니다.

우리가 하고 있는 일들이 다양한 논문에 나오는 부분도 있지만, 실제 프로덕션 레벨에서 알아야 할 게 많아서 현장에서 고민하고 배워야 할 요소들이 많습니다. 그럴 때는 기존 배경지식이 많은 분도 좋지만, 문제에 대해 고민하는 분과 함께 일하는 즐거움이 큽니다.

태호: 저는 도전에 열린 마음과 빠르게 실행하는 태도를 꼽고 싶어요. 문제가 복잡할수록 해 보기 전에는 알 수 없는 것들이 대부분이거든요. 빠르게 시도하고 결과물을 내서 다시 생각하는 과정이 필요합니다. 게다가 하드웨어의 깊은 구조 자체는 기밀 요소가 많아서 저희가 알 수 없는 부분이 많아요. 고객사와 소통하면서, 동시에 계속 시도하면서 인사이트를 빠르게 캐치해 나가야 합니다.

다음으로, 모델 최적화팀의 채용 전형 각 단계에서 무엇을 중점으로 보는지 두 분께 여쭤봤습니다.

Q. 서류 전형 | 단번에 시선을 사로잡는 이력서의 특징이 있을까요?

승주: 이력서의 정량적인 수치보다 GitHub처럼 결과물로 남아 있는 코드가 매력적으로 느껴져요. 실제로 제가 강력하게 추천했던 분이 있었는데, 다양한 도메인의 실험 코드를 GitHub에 정리해 두신 분이었어요. 단순히 코드 구현만 올린 게 아니라 ‘어떻게 구현했는지’를 잘 설명해 두셨더라고요. AI로 찍어낸 느낌이 아니라 직접 고민한 흔적이 강했어요. 그래서 어떤 문제를 어떤 방법론으로 해결했는지가 드러나는 포트폴리오가 시선을 사로잡는 것 같네요.

태호: 비슷한 맥락이에요. 쉽게 가져다 쓴 것보다 직접 쌓아 올린 결과물을 선호합니다. 비유하자면 ‘밀키트로 차린 한 상이 아니라, 직접 농사짓고 재료를 캐서 요리해 본 사람’이라고 표현하고 싶어요. 그리고 정량적으로는 LLM이나 양자화 관련 프로젝트 경험이 구체적으로 드러나면 자연스럽게 눈길이 갑니다. 반대로 JD와 연관성이 없는 경험만 서술한 이력서와 프로젝트는 많은데 디테일한 정보를 얻을 수 없는 이력서는 아쉽게 느껴지기도 해요.

마키나락스 FD 모델 최적화팀

Q. 사전 인터뷰 | 지원자와 주로 어떤 이야기를 나누시나요?

승주: 저는 사전 인터뷰를 기본적으로 저희가 ‘구애하는 시간’이라고 생각해요. 후보자께서 우리 팀에서 일하면 어떤 이력과 포트폴리오를 만들 수 있을지를 커리어 관점에서 주로 이야기합니다. 어떤 프로젝트가 있고 근무 형태는 어떤지 같은 기본적인 이야기도 나누고요. 서로 어필하고 교감하는 시간이라고 생각해 주시면 됩니다.

태호 : 덧붙여서 경험하신 프로젝트에 대한 질문을 드리기도 하는데, 자신의 지식을 기반으로 얼마나 논리를 잘 전개하시는가를 보고 있습니다. 단순히 말을 잘하는 것보단 그 고민에 대한 과정을 잘 설명해 주시는지를 사전 인터뷰에서는 중요하게 보고 있습니다

Q. 기술 인터뷰 | 기술인터뷰에서 보는 중요한 평가요소가 있다면요?

승주: 저희 질문은 기본적으로 지원자의 이력서와 맞닿아 있는 질문이에요. 자기가 했던 일을 얼마나 깊게 생각해보셨는지를 봅니다. 개인적으로 저는 태호님이 말씀하신 대로 명확한 논리로 자기 생각을 전개하는 분을 좋아해요. 그게 오답일지라도 그 문제에 대해 고민하고 본인만의 논리 구조를 세워보신 분이 인터뷰에서 좋은 평가를 받습니다. 그리고 자기 업무에서 아쉬웠던 점까지 솔직하게 드러내는 분이 오히려 매력적으로 느껴지기도 합니다.

태호: 우리 팀의 평가 기조가 다들 비슷해요. 저는 두 가지를 봅니다. 첫째는 이력서에 적힌 프로젝트를 디테일하게 설명할 수 있는지예요. 정말 본인이 그 일을 했는지, 면접관에게 얼마나 구체적으로 설명하는지를 보면서 검증합니다. 둘째는 양자화·최적화에 대한 이해도예요. 비중으로 보면 첫 번째 요소가 훨씬 커요. 후보자께서 가장 최근에 했던 과제조차 명확히 설명하지 못하면 아무래도 좋은 평가를 드리기엔 어려운 것 같습니다.

Q. 기술 인터뷰 | 지원자에게 꼭 질문하는 ‘시그니처 질문’이 있나요?

승주: 두 가지가 있어요. 연구 경험이 많은 분께는 가장 재밌게 읽었던 논문을 여쭤보고, 경력이 있는 분께는 “커리어에서 가장 이야기하고 싶은 부분, 어떤 문제를 어떻게 해결하셨나요?”를 묻습니다. 그리고 마지막엔 항상 저희 회사에 대해 궁금한 점을 여쭤봐요.

태호: 저는 지원자가 했던 프로젝트의 과제와 거기서 사용한 모델에 대해 구체적으로 파고듭니다. 본인의 성과를 과장해서 표현하거나 성공 사례만을 제시하는 것보다는 그 과정에서의 어려웠던 점과 같은 진솔한 답변을 듣고 싶어요.

Q. 마지막으로, 지원을 준비하는 예비 동료에게 한마디 부탁드립니다.

승주: 저희팀에 오시면 LLM의 동작 원리를 정말 깊이 이해하실 수 있습니다. ‘LLM을 탑재해 봤다’는 정량적 경험을 넘어서 모델이 어떻게 동작하는지를 근본적으로 알게 되는 거죠. 이 이해를 기반으로 GPU든 다른 환경이든 최적화로 확장할 수 있고요. 설레지 않나요? 합류하셔서 함께 행복하게, 즐겁게, 서로 성장하고 발전할 수 있으면 좋겠어요. 기다리고 있을게요!

태호: 지원 전에 자기가 해 온 일들을 한 번 정리하고 되새김질해 두시길 추천해요. 그리고 대표적인 LLM 모델 아키텍처를 직접 뜯어보며 공부한 뒤, 그 내용을 이력에 잘 담으면 전형 준비에 도움이 되실 겁니다. 제가 직장에서 가장 중요하게 생각하는 건 서로에 대한 응원과 지지예요. 그리고 우리는 그런 문화를 만들려고 늘 노력하는 팀입니다. 오시면 보람 있게 일하실 수 있을 거예요!

정해진 하드웨어 안에 거대한 LLM을 담는 일에는 정답지가 없습니다. 하드웨어는 천천히 발전하고, 기술은 빠르게 쏟아지고, 그 사이의 간극은 누군가 직접 깎고 메워야만 좁혀집니다. 모델 최적화팀은 그 간극 위에서 매일 가설을 세우고, 시도하고, 결과를 다시 들여다봅니다.

모델 최적화팀은 레퍼런스가 없는 길이기에 더 깊이 파고드는 사람들, 그리고 그 과정을 서로 응원하며 즐기는 사람들이 모인 팀입니다. 거대한 모델을 손안의 디바이스에 담는 이 항해에 함께할 동료를 기다리고 있습니다. 마음이 움직였다면, 지금 바로 채용 공고를 확인해 보세요!

Q. FD 모델 최적화팀이 하는 일을 소개해 주세요

Q. 아직은 생소한 개념들인 것 같은데, 팀에서는 구체적으로 어떤 일을 하고 있나요?

Q. 흥미롭네요. 모델 최적화팀에는 어떤 분들이 모여 시너지를 내고 있는지도 궁금합니다.

Q. 본인의 분야에 몰입하는 사람들이 모인 모델 최적화팀이군요. 팀에서는 어떤 기술을 주로 활용하나요?

Q. 한창 채용이 진행 중인데요. 미래의 동료에게 기대하는 역량과 태도는 무엇인가요?

Q. 서류 전형 | 단번에 시선을 사로잡는 이력서의 특징이 있을까요?

Q. 사전 인터뷰 | 지원자와 주로 어떤 이야기를 나누시나요?

Q. 기술 인터뷰 | 기술인터뷰에서 보는 중요한 평가요소가 있다면요?

Q. 기술 인터뷰 | 지원자에게 꼭 질문하는 ‘시그니처 질문’이 있나요?

Q. 마지막으로, 지원을 준비하는 예비 동료에게 한마디 부탁드립니다.

Related Resources

마키나락스 Fit 인터뷰 전, 가장 먼저 해야 할 일은?

산업이 오래 품어온 난제를 함께 풀 동료를 찾습니다 – FD 프론티어팀

마키나락스 소모임을 소개합니다

마키나락스 리브랜딩: 새 로고가 생겼습니다

시작부터 완성까지, 현장에서 작동하는 AI를 설계하는 PM 팀

산업 AI의 새로운 영역을 혁신하는 개척자들

보이지 않는 곳에서 실전 AI의 기반을 만드는 백엔드팀

마키나락스 1호 일본인 멤버가 말하는 ‘일본 제조 AI 시장 진출’ 이유

마키나락스 테크 직무를 소개합니다 — #2. Backend