블로그

  • 요즘 구조조정, 정말 AI 때문일까요?

    최근 몇 달 사이, 정말 많은 해고 소식이 들려옵니다. 2025년 9월까지 발표된 일자리 감축 소식만 해도 94만 건이 넘는다고 하죠. 작년 같은 기간보다 55%나 증가한 수치입니다.

    많은 사람들이 그 원인으로 AI를 지목합니다. 투자자들은 기업에게 AI를 어떻게 활용하고 있는지, 왜 비용 절감에 쓰지 않는지 묻기 시작했습니다. 하지만 이 모든 대규모 구조조정이 정말 AI 때문에 일어나는 걸까요? 어쩌면 우리가 진짜 이유를 놓치고 있는 건 아닐까요?

     

    AI는 정말 일자리를 대체하고 있나

    우리는 흔히 AI가 사람의 일을 간단히 대체할 수 있다고 생각합니다. 하지만 현실은 그렇게 단순하지 않습니다.

    기업이 AI를 도입해 비용을 절감하는 과정은 사실 매우 복잡하고 시간이 많이 듭니다. 결코 간단하거나 저렴하지 않죠.

    실제로 기업들은 “AI 컴퓨터 한 대로 직원 1만 명을 대체합니다”라고 말하지 않습니다. AI가 지금 당장 영향을 미치는 분야는 일부 저숙련 일자리에 한정될 뿐, 중간 관리자급의 화이트칼라 업무를 대체한다는 증거는 아직 찾기 힘듭니다.

     

    ‘AI 때문’이라는 말의 숨은 뜻

    그렇다면 왜 이렇게 AI가 주범처럼 이야기될까요? 여기에는 월스트리트의 기대감이 큰 역할을 합니다.

    AI 혁신에 대한 기대가 높아지면서, CEO들은 AI를 비즈니스에 활용해야 한다는 압박을 받고 있습니다. 심지어 AI 관련 성과를 내지 못하면 2년 안에 해고될 수 있다는 두려움을 느낀다는 CEO가 79%에 달한다는 조사도 있습니다.

    이런 상황은 경영진에게 ‘AI 워싱’의 유혹을 만듭니다. 실제로는 경영 실적이 나빠져서 사람을 내보내는 것인데도, “AI 때문에 구조조정을 한다”고 발표하는 것이죠.

    놀랍게도 월스트리트는 ‘AI’라는 단어가 붙은 발표를 좋아합니다. AI를 이유로 들면 주가가 오히려 오르는 현상까지 나타나고 있습니다.

     

    진짜 해고의 이유는 따로 있다

    사실 최근의 해고는 AI보다는 다른 이유와 더 깊게 연관되어 있습니다. 많은 경우, 이는 대대적인 기업 구조 개편이나 비용 절감 노력의 일환입니다.

    지난 몇 년간 많은 기업의 몸집이 거대해졌습니다. 불필요한 중간 관리 직책이 늘어나고, 하나의 프로젝트를 진행하는 데도 너무 많은 결재 단계를 거쳐야 했죠.

    소위 ‘기업 비만’ 상태가 된 것입니다. 직원들은 실제 일하는 시간보다 회의에 더 많은 시간을 쓰게 됩니다.

    하지만 고금리와 소비 심리 위축 같은 경제적 어려움이 닥치자, 기업들은 이런 비대한 구조를 더 이상 유지할 수 없게 되었습니다. 불필요한 관리 계층을 3~4단계씩 줄여야만 고객에게 더 빠른 결과물을 내놓을 수 있게 된 것이죠.

     

    구조조정은 정말 최선일까

    그렇다면 이렇게 인력을 감축하는 것이 항상 옳은 답일까요? 흥미롭게도 최근 몇 년간의 연구는 다른 이야기를 합니다.

    연구에 따르면, 해고를 최대한 미루고 버티는 기업이 장기적으로 더 나은 재무 성과를 거두는 것으로 나타났습니다.

    인력 감축으로 아낄 수 있는 비용은 생각보다 크지 않습니다. 반면, 나중에 경기가 회복되었을 때 새로운 사람을 뽑고 교육하며 조직을 안정시키는 데는 훨씬 더 큰 비용과 시간이 들기 때문입니다.

    ‘AI가 모든 일자리를 빼앗을 것’이라는 이야기는 매우 자극적입니다. 하지만 우리는 더 확실한 증거가 나오기 전까지, 이 말을 조금 더 신중하게 받아들일 필요가 있습니다.

     

    출처: CNBC 유튜브

     

  • AI 시대, ‘버티컬’에 집중해야 하는 이유

    인공지능(AI)이 마치 공기처럼 우리 삶에 스며들고 있습니다. 생성형 AI가 세상을 바꾸리라는 예측은 이제 기정사실처럼 느껴집니다. 하지만 이 거대한 변화 속에서, 정작 ‘나의 일’ 혹은 ‘우리 회사’의 미래 전략은 무엇이 되어야 할까요?

    무작정 AI 기술을 도입하는 것이 해답은 아닐 겁니다. 수많은 기업이 AI라는 거대한 파도 앞에서 고민합니다. 불확실한 미래에 대응하기 위한 선도적인 기업의 생존 전략은 우리에게 중요한 인사이트를 제공합니다. 글로벌 무대에서 AI를 통해 새로운 성장의 길을 모색하는 한 기업의 전략을 통해 그 답을 찾아봅니다.

     

    소버린 AI, ‘놓쳤을 때의 대가’에 투자해야 하는 이유

    현재 AI를 둘러싼 논의는 소버린 AI(Sovereign AI)와 버티컬 AI(Vertical AI) 두 축으로 나뉩니다.

    소버린 AI는 쉽게 말해 ‘국가적 차원의 AI 역량 확보’를 의미합니다. 주변의 평가를 들어보면 소버린 AI에 대해 부정적인 시각이 60%, 긍정적인 시각이 40% 정도라고 합니다.

    단순 확률로만 본다면 부정적인 의견이 더 많으니 시도하지 않는 것이 합리적일 수 있습니다. 그러나 이 계산에는 결정적인 함정이 있습니다. 만약 소버린 AI를 시도하지 않았는데 그 방향이 맞다면, 우리가 잃게 되는 기댓값은 상상 이상이기 때문입니다. 실패했을 때의 손실보다 성공했을 때의 기대 이익이 압도적으로 크다면, 확률이 낮더라도 도전하는 것이 옳습니다. 소버린 AI는 결국 ‘내수’를 위한 안전망이며, 놓치지 않기 위해 투자해야 할 영역입니다.

     

    결국 돈을 벌어오는 건 ‘버티컬 AI’다

    반면, 버티컬 AI는 우리에게 실질적인 성과를 가져다줄 ‘수출용’ 무기입니다. 소버린 AI가 한국 시장에서 뒤처지지 않기 위한 방어적 조치라면, 버티컬 AI는 해외에서 돈을 벌어오는 공격적인 전략입니다.

    버티컬 AI를 키우는 것은 단순히 특정 산업에 AI를 적용하는 것을 넘어섭니다. 이 전략은 막대한 투자와 동시에 글로벌 스케일로 인프라를 구축해야만 성공할 수 있습니다. 예를 들어, 야놀자는 지난 10년간 축적한 데이터를 기반으로 여행 산업에서 세계 시장을 선도하는 버티컬 AI를 만들겠다는 목표를 세웠습니다. 돈을 벌어올 영역에 대한 객관적이고 구체적인 계획이 필수적입니다.

     

    AI 인프라를 넘어 수요를 창출할 ‘글로벌 스케일’ 전략

    AI 경쟁력을 갖추기 위해서는 크게 세 가지 축이 필요합니다. ‘머리’ 역할을 하는 소버린 AI, 그리고 이를 뒷받침할 데이터센터, 마지막으로 실질적 수익을 창출할 버티컬 AI입니다.

    특히 데이터센터 구축에 대해서는 신중해야 합니다. 과거 한국이 수요 고민 없이 에어하우스를 지었다가 비어있던 것처럼, 수요 예측 없이 AI 데이터센터만 짓는 것은 위험합니다.

    AI 데이터센터는 지역(로컬) 단위가 아닌 글로벌 네트워크 스케일로 구성되어야 합니다. 정부와 협력하여 스타게이트(Stargate) 프로젝트와 같은 방식으로 글로벌 파트너십을 맺어야 수요에 대한 우려를 해소할 수 있습니다. 나아가, 기업이 해외 사업을 할 때 인지도가 부족하다면 ‘대한민국’이라는 브랜드를 적극적으로 활용해야 합니다. 현재 K-컬처를 필두로 한 한국의 소프트파워는 해외에서 매우 높이 평가받고 있습니다. 이 국가 브랜드는 기업의 부족한 인지도를 메워주는 강력한 글로벌 자산입니다.

     

    완벽한 ‘개인화’와 ‘운영 자동화’로 만드는 Vic AI의 미래

    궁극적으로 버티컬 AI 기업이 지향해야 할 목표는 명확합니다. 공급자를 위해서는 완벽한 운영 자동화를 이루어 매출과 이익을 극대화해야 합니다. 예를 들어, 고객이 호텔에 도착했을 때 리셉션 직원이 오래 걸리는 복잡한 체크인을 대체하는 ‘스마트 프론트’ 서비스가 있습니다. 하드웨어와 고객 간의 커뮤니케이션을 고도화하여 줄을 서는 불편함이나 키 카드 오류, 퇴실 시 불이 켜진 채로 나가는 비효율까지 모두 제거하는 것입니다.

    사용자(고객)에게는 완벽한 개인화된 경험을 제공해야 합니다. 나에게 가장 합리적인 가격의 제품을 찾도록 돕는 것입니다. 이는 단순히 마진을 줄여 가격을 낮추는 방식이 아닙니다. 개인에게 최적화된 상품을 추천함으로써 원가를 절감하고 그만큼 가격을 낮추는 지속 가능한 방식입니다. 이러한 자동화와 개인화가 결합되어 AI 에이전트가 오케스트레이션을 하는 구조가 완성될 때, 가장 대표적인 버티컬 AI 기업이 탄생하게 됩니다.

     

    새로운 도전을 위한 ‘타이밍’과 ‘능력’

    지금은 스타트업에게 또 다른 기회의 ‘타이밍’이 왔습니다. 모바일 혁명기에 인프라를 깔았던 기업보다 그 위에서 서비스를 만든 기업들이 결국 스타가 되었습니다. AI 역시 마찬가지입니다. 현재는 AI 인프라가 깔리는 시기이며, 이것이 완성되고 나면 ‘수요’가 폭발할 것입니다. 그리고 그 수요는 서비스 기업에서 올 것입니다. 지금이 바로 모바일 시대의 재림과 같은 혁신적인 기회의 순간입니다.

    다만, 이 기회를 잡기 위해서는 능력에 대한 자기 객관화가 필수입니다. 시장의 움직임, 고객의 페인 포인트(Pain Point), 그리고 성공을 위해 내가 갖춰야 할 능력에 대해 얕게 접근해서는 안 됩니다. 깊게 파고들수록 성공 확률이 높아집니다. 새로운 기회가 온 지금, 치열함과 치밀함을 바탕으로 깊이 있는 분석과 실행만이 우리를 미래로 이끌 것입니다.

     

    출처: 티타임즈TV 유튜브

     

  • “내 옆자리 동료가 사라진다”: 버티컬 AI 에이전트가 만드는 SaaS 이후의 비즈니스

    요즘 기술의 발전 속도는 눈부실 정도입니다. 몇 달 전만 해도 챗봇 수준이던 AI가 이제는 팀 전체를 대체하는 수준으로 발전하고 있습니다. 우리가 매일 사용하는 수많은 소프트웨어(SaaS)가 실리콘밸리의 20년을 지배했다는 사실을 알고 계십니까? 그런데 이보다 10배 더 거대한 시장이 열리고 있다는 주장이 나옵니다. 이 새로운 물결의 핵심은 바로 ‘수직형 AI 에이전트’입니다. 이 변화가 우리의 일터와 비즈니스를 어떻게 바꿀지 지금부터 살펴보겠습니다.

    사스(SaaS) 시대의 막을 올린 의외의 주역

    사스(SaaS)가 어떻게 시작되었는지부터 이해해야 합니다. 지난 20년간 실리콘밸리 벤처 캐피탈의 40% 이상이 SaaS 기업에 투자되었습니다. 300개가 넘는 유니콘 기업이 이 카테고리에서 탄생했습니다. 이 거대한 흐름을 만든 숨겨진 기술적 촉매는 XML HTTP Request였습니다. 2004년, 웹 브라우저가 이 기능을 추가하면서 데스크톱 애플리케이션처럼 풍부한 사용자 경험을 웹에서도 구현할 수 있게 되었습니다. 이로써 소프트웨어는 CD-ROM 박스에서 웹사이트로 옮겨갔고, 구글 맵스나 지메일 같은 서비스가 등장했습니다.

    사스(SaaS) 시장을 스타트업이 점령한 이유

     클라우드와 모바일 시대가 열렸을 때, 모두가 예상한 대규모 소비자 시장은 결국 구글, 페이스북 같은 기존 거대 기업의 승리였습니다. 하지만 스타트업은 두 영역에서 승리했습니다. 하나는 에어비앤비나 우버처럼 아무도 예측하지 못한 소비자 대상 사업입니다. 다른 하나가 바로 B2B SaaS 영역이며, 여기서 가장 많은 유니콘이 탄생했습니다. 오라클이나 SAP 같은 대형 업체들이 모든 것을 포괄하는 솔루션을 제공했지만, 사용자 경험은 나빴습니다.

    인사 관리 전문 구스토(Gusto)의 경우처럼, 급여 정산 규제나 인사 시스템의 복잡한 뉘앙스를 거대 기업은 따라올 수 없었습니다. 해당 분야에 대한 깊은 이해(도메인 전문성)가 필요한 틈새시장을 수직형 SaaS가 파고들었습니다. 수백 개의 전문 분야를 깊이 이해하고 케어하는 것은 단일 기업으로는 불가능에 가까웠습니다.

    AI 에이전트가 사스보다 10배 크다고 평가받는 결정적 차이

     LLM(대규모 언어 모델)은 XML HTTP Request처럼 새로운 컴퓨팅 패러다임을 열었습니다. 사스 기업이 기존 박스형 소프트웨어를 대체했듯이, 이제 수직형 AI 에이전트는 사스 기업을 대체할 것입니다. 기존 사스 소프트웨어는 사용하기 위해 여전히 운영팀이나 인력을 필요로 했습니다.

    하지만 AI 에이전트는 소프트웨어와 인력을 하나로 통합합니다. 기업의 지출 중 소프트웨어 비용은 미미하지만, 인건비는 가장 큰 비중을 차지합니다. AI 에이전트는 반복적인 단순 데이터 입력이나 승인 작업 인력을 대체하며 비용 효율을 극대화합니다. 이 효율성 덕분에 수직형 AI 에이전트 시장은 기존 사스 시장보다 10배나 커질 수 있다는 분석이 나옵니다.

    동료의 반발을 피하고 성장하는 탑다운 판매 전략

     AI 에이전트를 도입하려는 스타트업은 새로운 과제에 직면합니다. 소프트웨어의 잠재적 고객이 곧 AI로 대체될 위협을 느끼는 직원일 수 있기 때문입니다. 따라서 판매 전략은 중요합니다. 제품 품질(QA) 테스트 자동화 기업의 경우를 생각해 봅시다. QA 팀에게 판매하면 반발에 부딪힐 수 있습니다.

    대신 이들은 엔지니어링 팀장이나 CEO를 대상으로 판매합니다. “이 제품이 QA 인력을 줄여줍니다”라고 솔직하게 말하는 것입니다. 이를 통해 당사자들의 저항 없이 대규모 도입을 이끌어내고 빠른 성장을 달성합니다. 개발자 지원 챗봇, 자동차 대출금 회수 전화 자동화 같은 사례 모두 해당 산업에 대한 깊은 이해가 기반입니다.

    천억 달러 유니콘을 만들 아이디어 찾는 법

    수직형 AI 에이전트의 기회를 찾는 공식은 의외로 간단합니다. 바로 ‘지루하고 반복적인 관리 업무’를 찾아내는 것입니다. 예를 들어, 한 스타트업은 정부 조달 웹사이트를 하루 종일 새로고침하며 입찰 공고를 찾던 친구의 업무를 AI 에이전트로 대체했습니다.

    다른 창업가는 치과 의사인 어머니의 진료 과정을 지켜보다가 복잡한 의료비 청구 과정을 AI로 자동화했습니다. 로봇공학에서 ‘더럽고 위험한 일’을 로봇이 담당하듯, AI 에이전트는 기업 내의 ‘지루한 버터 전달 업무(butter passing jobs)’를 맡게 될 것입니다. 본인이 가장 잘 아는 도메인에서 반복되는 고통스러운 작업을 찾아야 합니다.

    수직형 AI 에이전트는 단순한 소프트웨어 업그레이드를 넘어섭니다. 이는 비즈니스 운영 방식 전체를 혁신하는 근본적인 변화입니다. 이미 많은 기업이 10명의 인력만으로 수억 달러의 매출을 올릴 수 있는 모델을 구축하고 있습니다. 우리가 사는 세상은 이미 새로운 컴퓨팅 시대로 진입했습니다. 지금이 바로 이 새로운 물결에 올라타, 당신의 전문 분야에서 다음 ’10배’의 기회를 포착해야 할 때입니다.

     

    출처: Y Combinator 유튜브

  • 수많은 AI 툴 앞에서 길을 잃는 당신에게: ‘지휘자 AI’ 오케스트레이터 에이전트가 답인 이유

    매일매일 쏟아지는 업무 속에서 우리는 수많은 도구와 AI 서비스를 사용하고 있습니다. 하지만 단순한 하나의 작업을 처리하기 위해 여러 시스템 사이를 오가며 데이터를 옮기고 붙여넣는 일에 지치지는 않으셨나요? 흩어진 여러 도구들을 하나의 ‘신경 시스템’처럼 엮어내, 복잡한 업무를 스스로 완수하는 새로운 AI의 시대가 열리고 있습니다. 바로 이 모든 과정을 조율하는 핵심이 ‘오케스트레이터 에이전트’입니다. 이는 곧 당신의 비효율적인 업무 방식을 근본적으로 개선할 열쇠가 될 것입니다.

    오케스트레이터 에이전트: AI 도구들의 ‘신경 시스템’

    오케스트레이터 에이전트는 여러 AI 에이전트나 도구들의 작업을 총괄하고 감독하는 ‘지휘자’ 역할을 수행합니다. 이 에이전트 덕분에 다양한 보조 에이전트들이 협력하여 하나의 목표를 효율적으로 달성할 수 있습니다. 수많은 하위 에이전트와 도구들이 함께 움직이며 복잡한 작업을 처리할 때, 우리는 이것을 멀티 에이전트 시스템(Multi-Agent System, MAS)이라고 부릅니다. 오케스트레이터는 이 MAS의 효율적인 운영을 가능하게 하는 핵심 요소입니다.

     

    감사 노트 작성 요청, AI는 네 단계를 거칩니다

    우리가 오케스트레이터 에이전트에게 “최근 프로젝트를 도와준 팀원들에게 맞춤형 감사 노트를 작성해줘”라고 요청하는 상황을 가정해 봅시다.
    이 에이전트는 작업을 시작하기 전, 데이터 접근을 위한 API 연결과 업무 실행 순서를 먼저 정의합니다.
    이후 에이전트 선정, 워크플로우 조정, 데이터 공유, 지속적인 학습이라는 네 가지 핵심 단계를 순차적으로 실행합니다. 이 과정을 통해 요청 사항은 인간의 개입 없이 매끄럽게 완성됩니다.

     

    작업에 적합한 ‘최적의 동료’를 선택하는 방법

    가장 먼저 오케스트레이터는 작업에 필요한 최적의 에이전트와 도구를 카탈로그에서 신중하게 고릅니다. 감사 노트 작성이라는 임무를 위해, 오케스트레이터는 세 가지 시스템과의 협력을 결정할 수 있습니다. 이는 팀원 정보가 담긴 프로젝트 관리 시스템, 특정 톤으로 글을 쓰는 이메일 생성 에이전트, 그리고 사내 직원 감사 앱입니다. 올바른 도구를 선택하는 이 과정은 오케스트레이터가 작업을 효율적으로 진행하기 위한 첫걸음이 됩니다.

     

    API를 활용한 워크플로우의 ‘조율’과 ‘실행’

    에이전트 선정을 마친 오케스트레이터는 이제 전체 작업을 여러 하위 작업으로 쪼갭니다. 그리고 이를 적절한 에이전트나 도구에 할당하며 실행을 지시합니다. 오케스트레이터는 API를 통해 프로젝트 관리 시스템에 연결하여 프로젝트에 참여한 팀원 정보를 확인합니다. 이후 이메일 생성 에이전트를 활용해 원하는 톤과 스타일로 맞춤형 감사 메시지를 작성합니다. 마지막으로, 사내 앱을 통해 실제로 노트를 발송하도록 모든 과정을 조율합니다.

     

    이질적인 시스템을 연결하는 ‘USB-C 포트’: MCP

    여기서 만약 팀원 정보가 있는 시스템과 감사 노트를 생성하는 AI가 서로 다른 회사에서 만들었다면 어떻게 될까요? 이질적인 시스템들은 서로의 데이터 구조를 알지 못해 통신할 수 없습니다. 이 문제 해결의 핵심이 바로 **모델 컨텍스트 프로토콜(Model Context Protocol, MCP)**입니다. 이 기술은 AI 애플리케이션을 위한 ‘USB-C 포트’와 같아서, 서로 다른 제조사의 장치라도 표준화된 방식으로 연결합니다.

     

    MCP의 작동 원리: 모델, 컨텍스트, 프로토콜

    MCP를 통해 에이전트는 데이터의 저장 위치나 검색 방법을 알지 못해도 “X에 대한 정보를 줘”라고 요청할 수 있게 됩니다. 여기서 M은 에이전트의 중심에 있는 대규모 언어 모델(Model)을 의미합니다. C는 작업 수행에 필요한 문서나 검색 결과 등 모든 추가적인 정보(Context)를 통칭합니다. 마지막으로 P는 모델이 다양한 도구 및 데이터 소스와 상호 작용할 수 있도록 하는 표준화된 통신 방식(Protocol)입니다.

     

    작업의 완성: 산출물과 끊임없는 학습

    각 하위 에이전트는 작업을 실행한 후 그 정보를 오케스트레이터 에이전트에게 다시 보냅니다. 오케스트레이터는 이 결과를 하나로 묶어 ‘산출물(Artifact)’이라는 완성된 형태로 포장합니다. 최종적으로 오케스트레이터는 팀원들에게 멋지게 작성된 감사 노트를 전달하며 업무를 마무리합니다. 더 나아가, 이 에이전트는 완료된 작업을 되돌아보며 성능을 모니터링하고 다음번 작업을 위해 개선 사항을 반영하는 지속적인 학습 과정을 거치게 됩니다.

     

    오케스트레이터 에이전트를 활용한 멀티 에이전트 시스템은 단순한 자동화를 넘어섭니다. 이는 복잡하게 얽힌 업무 환경 속에서 AI가 스스로 생각하고, 협력하고, 개선하는 ‘똑똑한 자동화’의 미래를 제시합니다. 당신이 직접 여러 도구를 감독하는 대신, 이 ‘지휘자 에이전트’에게 일을 맡기고 더 중요한 핵심 업무에 집중해보세요.

    출처: IBM Technology 유튜브

     

  • AI 비서에게 10억 예산 결재를 맡긴다면? — 위험한 AI 행동을 막는 ‘휴먼 인 더 루프’ 미들웨어

    방금 AI 비서가 중요한 파트너에게 메일을 보냈다는 알림을 받았습니다. 하지만 메일 내용이 내가 의도했던 것과 완전히 다르다면 어떨까요?

    특히 AI 에이전트가 ‘실행력’을 갖게 될 때, 사용자의 불안감은 커질 수밖에 없습니다. 메일 발송이나 대규모 예산 승인처럼 한 번 실행되면 되돌릴 수 없는 행동을 AI가 하기 직전, 인간이 멈춰 세우고 확인해야 합니다.

    이러한 AI의 위험하거나 비싼 행동을 사전에 방지하는 것이 바로 ‘휴먼 인 더 루프(Human-in-the-Loop, HIL)’ 미들웨어의 핵심입니다. HIL은 AI의 효율성과 인간의 최종 통제력을 결합하는 필수적인 안전장치입니다.

     

    AI 에이전트의 기본적인 ‘실행 루프’

    AI 에이전트는 기본적으로 모델이 외부 도구를 호출하는 반복적인 작업을 수행합니다. 모델은 최종적인 응답을 사용자에게 전달하기 전까지 필요한 도구를 연쇄적으로 계속 실행합니다.
    예를 들어, 메일을 보내야 한다면 ‘메일 발송 도구(Send Email Tool)’를 호출하는 식입니다. HIL 미들웨어는 이 실행 루프의 중간에 인간의 개입 단계를 추가하여 안전성을 높입니다.

     

    비싸거나 위험한 도구 실행을 막는 방패

    HIL 미들웨어는 도구 실행이 실제 돈이 들거나(Expensive) 큰 비즈니스 리스크를 수반할 때 특히 유용합니다. 실제 결제가 일어나는 금융 API를 호출하거나, 대량의 고객 데이터를 삭제하는 등의 행위가 여기에 해당합니다. 미들웨어는 모델이 도구 호출을 결정하는 순간 그 실행을 잠시 멈춥니다. 그 후 인간 사용자의 최종적인 피드백을 받고 나서야 실제 도구 실행을 조건부로 재개합니다.

     

    HIL 미들웨어가 제공하는 세 가지 의사결정 방식

    HIL은 단순한 ‘실행 또는 중지’를 넘어 세밀한 인간의 통제를 지원합니다. 사용자가 AI의 잠재적 행동에 대해 내릴 수 있는 가장 일반적인 세 가지 의사결정 방식이 있습니다.

    첫째, 승인(Approval)은 AI가 작성한 내용(예: 메일 초안)을 검토한 후 이상이 없다고 판단할 때 사용합니다. 초안은 작성된 그대로 최종 발송이 진행됩니다.
    둘째, 수정(Edit)은 AI의 초안에 수신자 변경이나 문구 수정과 같은 부분적인 편집이 필요할 때 사용합니다. 수정된 내용을 바탕으로 도구 실행이 즉시 재개됩니다.
    셋째, 거부(Rejection)는 AI의 초안을 완전히 거부하고 모델에게 왜 다시 작성해야 하는지 피드백 메시지를 제공할 때 선택합니다.

     

    100만 달러 예산 승인 사례로 본 안전장치 작동

    예를 들어, AI 에이전트에게 100만 달러(약 10억 원) 규모의 분기 예산 승인 메일을 파트너에게 작성하도록 요청하는 상황을 가정해 봅시다. AI는 “검토 후 승인했습니다”는 내용으로 메일 초안을 만들고 이를 발송 도구에 전달합니다.

    이때 HIL 미들웨어가 즉시 개입하여 실행을 가로챕니다. 만약 성급한 승인이 부담된다면, 사용자는 ‘수정’ 옵션을 선택하여 “제안을 상세 검토 중입니다. 곧 최종 확정본을 보내드리겠습니다”라는 신중한 문구로 직접 변경하여 발송할 수 있습니다.

    혹은 ‘거부’ 옵션으로 “세부 제안 내용에 대한 더 많은 정보가 필요합니다”라는 메시지를 모델에 되돌려 보냅니다. 모델은 이 피드백을 학습하여 메일 초안을 개정하고, 개정된 초안은 다시 HIL 미들웨어를 거쳐 최종 승인을 기다리게 됩니다.

    HIL 미들웨어는 AI 에이전트가 복잡하고 민감한 비즈니스 로직을 수행하는 환경에서 인간의 통제력을 유지하는 핵심 기술입니다. 우리는 AI에게 업무를 위임하는 동시에, 최종적인 책임과 판단을 놓치지 않는 균형 잡힌 시스템을 구축해야 합니다.

     

    출처: LangChain 유튜브

     

  • 엘리븐랩스 CEO가 말하는 ‘음성 인터페이스’ 혁신

    다음 세대 AI는 왜 인간의 감정을 이해해야 하는가? 엘리븐랩스 CEO가 말하는 ‘음성 인터페이스’ 혁신

    혹시 해외 영화를 볼 때 어색한 한국어 더빙 때문에 몰입이 깨진 경험이 있으신가요? 혹은 AI 스피커에게 말을 걸 때, 감정 없는 모노톤의 답변에 답답함을 느낀 적은 없으신가요? 기술이 발전했음에도 불구하고, 여전히 우리가 마주하는 AI 음성은 차갑고 기계적입니다.

    우리의 일상 대화는 단순한 단어 전달이 아닌, 감정과 뉘앙스가 담긴 복잡한 경험입니다. 그리고 바로 이 지점, ‘인간의 감정을 포착하는 음성 AI’에 집중하여 폭발적으로 성장한 기업이 있습니다. 바로 엘리븐랩스(ElevenLabs)입니다. 엘리븐랩스의 CEO인 마티 스타니셰프스키(Mati Staniszewski)가 말하는 다음 세대 AI 인터페이스의 혁신 전략을 깊이 들여다봅니다.

     

    감정을 이해하는 음성 합성: AI의 새로운 문맥 이해 능력

    엘리븐랩스가 처음 해결하고자 했던 문제는 ‘문맥’이었습니다. 기존의 음성 합성(Text-to-Speech) 모델은 단지 텍스트를 소리로 변환하는 역할에 머물렀습니다. 하지만 엘리븐랩스는 단순히 텍스트를 읽는 것을 넘어섭니다.

    이들의 모델은 문장이 담고 있는 감정과 억양, 맥락을 이해하고 목소리에 반영합니다. 나이, 성별, 특정 지역의 억양과 같은 미세한 목소리 특성까지 포착하여 구현해냅니다. 이 핵심 기술을 바탕으로 엘리븐랩스는 텍스트-음성 변환뿐만 아니라 음성-텍스트, 그리고 AI 에이전트 플랫폼까지 영역을 확장하고 있습니다.

     

    속도를 위한 결단: 연구와 제품 사이의 3개월 규칙

    기술 스타트업이 마주하는 가장 어려운 숙제는 연구(R&D)의 완성도와 제품(Product) 출시 속도의 균형을 맞추는 일입니다. 엘리븐랩스 역시 이 딜레마를 피해 갈 수 없었습니다. 초기에는 고객들이 음성 속도를 조절하는 슬라이더 기능을 요구했습니다.

    하지만 CEO는 단순한 편집 기능을 추가하기보다는 연구 단계에서 음성 속도를 완벽하게 해결하려 했습니다. 결국 9개월 동안 연구팀은 이 문제를 풀지 못했고, 그 사이에 제품팀이 간단한 슬라이더 기능을 출시했습니다. 이 경험을 통해 엘리븐랩스는 중요한 교훈을 얻었습니다. 만약 연구 해결에 3개월 이상이 걸릴 것이 예상되면, 제품팀은 즉시 사용자에게 필요한 임시 기능이라도 출시하여 시장의 피드백을 받기로 결정했습니다.

     

    전권을 부여한 소규모 팀과 타이틀 없는 조직 문화

    엘리븐랩스는 조직 구조에서도 독특한 방식을 고수합니다. 현재 5명에서 10명 규모의 소규모 제품팀 약 20개가 운영되고 있습니다. 각 팀에게는 제품 출시에 대한 완전한 독립성과 전권이 부여됩니다.

    이러한 방식은 중복된 작업을 발생시키기도 하지만, 팀원 개개인의 오너십을 극도로 높이는 결과를 가져왔습니다. 또한, 엘리븐랩스는 1년 전부터 직위(Title)를 없앴습니다. 팀에 합류한 지 얼마 되지 않았더라도, 뛰어난 능력과 열정을 보여주면 연차에 상관없이 빠르게 영향력을 발휘할 수 있습니다.

     

    창작 생태계와의 상생: 보이스 마켓플레이스 전략

    AI가 등장했을 때, 창작자들 사이에서는 일자리를 위협하는 기술이라는 부정적인 반응이 많았습니다. 엘리븐랩스는 이러한 초기 반발을 피하고 산업과 함께 성장하는 전략을 택했습니다. 이들이 출시한 서비스가 바로 ‘보이스 마켓플레이스’입니다.

    성우나 일반 사용자는 자신의 목소리를 공유하고, 해당 목소리가 사용될 때마다 수익을 분배받습니다. 현재까지 약 1만 개의 목소리가 등록되었고, 커뮤니티에 100억 원 이상의 수익이 지급되었습니다. 이 전략은 AI가 일방적으로 산업을 파괴하는 것이 아니라, 오히려 새로운 수익 창출 기회를 제공할 수 있음을 입증했습니다.

     

    기업 전환의 핵심: 인센티브 설계

    엘리븐랩스는 개인 사용자 중심의 PLG(Product-Led Growth) 모델로 시작했지만, 결국 엔터프라이즈(기업) 시장으로 진출했습니다. 기업 고객을 유치하는 과정은 단순히 제품이 좋은 것을 넘어섭니다. 보안, 규정 준수, 그리고 99.99% 이상의 고가용성을 갖춘 인프라 구축이 필수적입니다.

    특히 흥미로운 점은 기업 영업팀의 인센티브(성과급) 설계에 대한 CEO의 통찰입니다. 조직이 커지면서 인센티브 구조는 결국 회사의 전략을 결정하는 ‘후행 지표’가 됩니다. CEO는 영업팀에게 인센티브를 포기하더라도, 장기적인 회사 전략에 해가 되는 딜(예: 경쟁사에 핵심 모델을 판매하는 행위)은 스스로 거절하도록 독려했습니다. 이처럼 인센티브와 전략을 일치시키는 것이 대규모 조직을 이끄는 핵심입니다.

    엘리븐랩스의 이야기는 단순히 목소리 기술의 발전사를 넘어, 급변하는 AI 시대에 기업이 어떻게 문화, 조직 구조, 그리고 시장 전략을 동시에 혁신해야 하는지를 보여줍니다. 인간의 감정을 이해하는 AI를 만들겠다는 목표처럼, 그들의 경영 방식 또한 인간적인 연결과 오너십을 기반으로 하고 있습니다.

    출처: a16z 유튜브

     

  • 왜 우리의 AI 앱은 데모에서만 완벽할까?

    멋진 AI 데모를 보고 감탄한 경험, 다들 한 번쯤 있죠. 하지만 막상 우리가 만든 AI 제품을 출시하면, 예상치 못한 곳에서 문제가 터지곤 합니다. 분명히 테스트할 땐 완벽했는데, 왜 이런 일이 생길까요? 이 글은 AI 앱의 품질을 ‘진짜로’ 측정하고 개선하는 법에 대한 이야기입니다.

     

    테스트를 통과한 ‘과일 글자 수 세기’ 앱

    여기 ‘과일 글자 수 세기’라는 간단한 앱이 있습니다. 말 그대로 과일 이름의 글자 수를 세어주는 AI 앱입니다. ‘apple’을 입력하니 ‘5’이라고 정확히 답했습니다. 두 번이나 테스트에 성공했고, 저희는 자신 있게 제품을 출시했습니다.

     

    “딸기에 R이 2개라는데요?”

    하지만 출시 직후, ‘존’이라는 이름의 사용자에게서 트윗이 날아왔습니다. “딸기(Strawberry)에 R이 몇 개냐고 물었더니 2개라고 답했어요.” AI 모델은 본질적으로 신뢰하기 어렵습니다. 데모에서는 멋져 보이지만, 실제 운영 환경에서는 환각(Hallucination)이 우리를 기다립니다.

     

    프롬프트 엔지니어링, 10번의 성공, 그리고 또다시 실패

    우리는 포기하지 않고 프롬프트를 개선하기 위해 밤을 새웠습니다. “활기 넘치는 과일 애호가 AI…”로 시작하는 멋진 프롬프트를 만들었습니다. 이번엔 같은 질문으로 10번 연속 테스트했고, 10번 모두 성공했습니다.

    하지만 존은 다시 나타났습니다. 그는 이번에 “딸기, 바나나, 파인애플, 망고…” 등 긴 과일 목록을 한꺼번에 질문했습니다. 사용자는 우리가 상상하지 못한 방식으로 앱을 사용합니다. 앱의 로그인, UI 등 95%가 완벽해도, 가장 치명적인 5%의 AI 로직이 실패할 수 있습니다.

     

    해답은 ‘농구 코트’에 있습니다

    여기서 바로 ‘이밸(Eval)’, 즉 AI 평가의 개념이 등장합니다. 이를 설명하기 위해 농구 코트 비유를 들어보겠습니다. 골대는 ‘정답’, 농구공을 던지는 행위는 ‘사용자 질문(Task)’입니다. 슛이 성공하면 ‘파란색 점(성공)’, 실패하면 ‘빨간색 점(실패)’입니다.

     

    우리 앱의 ‘코트’는 어떻게 생겼을까?

    좋은 이밸을 만들려면, 먼저 우리 앱의 ‘코트’를 이해해야 합니다. “딸기에 R이 몇 개?”처럼 쉬운 질문은 골대와 가까운 ‘파란 점’일 것입니다. 존의 긴 과일 목록 질문은 골대에서 아주 먼 ‘빨간 점’이겠죠.

    이 ‘코트’를 그릴 때 흔히 빠지는 함정이 있습니다. 첫째, ‘코트 밖(out-of-bounds)’ 질문에 시간을 낭비하는 것입니다. ‘당근의 음절은 몇 개?’ 같은 질문은 우리 앱의 영역이 아니죠. 둘째, 골대 앞 쉬운 질문만 테스트하는 것입니다. 코트의 경계를 명확히 알고, 구석구석 모든 영역을 테스트해야 합니다.

     

    사용자 데이터 수집, 지름길은 없습니다

    이 빨간 점과 파란 점들은 어떻게 수집할까요? 사용자의 ‘좋아요/싫어요’ 피드백은 훌륭한 신호가 될 수 있습니다. 꾸준히 로그를 살피며 무작위 샘플을 확인하는 것도 좋은 방법입니다.

    커뮤니티 포럼이나 트위터에서 사용자의 실제 불만을 직접 파악할 수도 있습니다. 안타깝게도 이 ‘코트’를 이해하는 작업에는 지름길이 없습니다. 제대로 된 데이터셋을 구축하면, 우리 시스템이 코트의 ‘우측 하단’에서 유독 약하다는 식의 명확한 진단을 내릴 수 있습니다.

     

    이밸은 유닛 테스트가 아닙니다

    이밸은 유닛 테스트와 근본적으로 다릅니다. 이밸은 ‘실전 연습’에 가깝습니다. “딸기에 R이 몇 개?” 같은 ‘데이터(질문)’는 상수로 고정합니다.

    우리가 실제로 바꾸며 테스트할 것은 ‘태스크(변수)’입니다. 예를 들어, 새로운 시스템 프롬프트나 RAG 설정을 이 변수에 넣고 테스트합니다. 이렇게 하면, 연습(이밸)이 실전(운영)과 거의 동일한 코드를 공유하게 되어 매우 효율적입니다.

     

    점수 매기기, 단순할수록 좋습니다

    마지막 단계는 이 슛이 성공했는지 ‘점수’를 매기는 것입니다. 이 점수 시스템은 가능한 한 ‘결정론적(deterministic)’이고 ‘성공/실패’로 명확해야 합니다. 점수판이 복잡하면 무엇이 잘못됐는지 디버깅하기가 극도로 어려워집니다.

    스스로에게 “이 테스트가 실패했다는 것을 알려면 무엇을 확인해야 하지?”라고 질문해 보세요. 때로는 이밸 전용 프롬프트에 <answer> 같은 태그를 추가해, 점수 매기기(스트링 매칭)를 더 쉽게 만드는 트릭을 쓸 수도 있습니다. 정 코드로 만들기 어렵다면, 사람이 직접 리뷰하는 것도 괜찮습니다.

     

    측정이 없으면, 개선도 없습니다

    이밸 시스템을 CI(지속적 통합)에 연결하는 것을 적극 권장합니다. 동료가 프롬프트를 수정한 PR을 올렸을 때, 이 변경이 코트의 한쪽을 고쳤지만 다른 쪽을 망가뜨렸는지 바로 알 수 있습니다. “측정 없는 개선은 제한적이고 부정확합니다.”

    이밸은 우리에게 시스템을 체계적으로 개선할 수 있는 ‘명확성’을 줍니다. 이는 더 높은 신뢰도, 더 높은 품질로 이어집니다. 결국 고객 지원에 쏟는 시간을 줄이고, 더 나은 사용자 경험을 만드는 선순환을 만들게 될 것입니다.

    출처: AI Engineer 유튜브

     

  • AI가 내 은행 계좌를 관리하는 날

    매달 나가는 대출 이자나 카드 값을 보며 ‘이게 정말 최선일까?’ 고민해본 적 있으신가요? 더 좋은 조건이 어딘가 있을 것 같은데, 일일이 찾아보고 서류를 준비할 생각을 하면 눈앞이 깜깜해집니다.

    만약 나도 모르는 사이, 인공지능 비서가 내 모든 금융 상품을 분석해 더 저렴한 대출로 갈아타고, 이 과정을 전부 자동으로 처리해 준다면 어떨까요? 공상 과학 영화 이야기가 아닙니다. 우리가 모르는 사이, AI는 은행 산업의 지도를 완전히 새로 그리고 있습니다.

     

    내 돈을 지켜주는 진짜 비서

    클라르나(Klarna)의 CEO는 10년 전부터 이런 미래를 꿈꿨습니다. 바로 ‘디지털 금융 비서’입니다. 이 비서는 단순히 지출을 요약해 주는 가계부가 아닙니다. 내 주택담보대출 금리가 너무 높다고 판단하면, 즉시 더 좋은 조건을 찾아냅니다.

    “더 나은 제안을 찾았습니다. ‘예’라고만 하시면 모든 서류 작업을 대신 처리해 드릴게요.”

    마치 자율주행차가 언젠가 도로를 가득 메울 것을 알지만 그 시점은 정확히 모르듯, 금융 비서의 등장도 마찬가지입니다. 이는 은행 산업에 거대한 변화를 예고합니다.

     

    은행이 더 이상 ‘갑’이 아니게 될 때

    지금까지 우리는 은행을 바꾸는 것을 매우 어렵고 귀찮은 일로 여겼습니다. 데이터를 옮기고 서류를 챙기는 과정이 복잡하기 때문입니다. 은행들은 이 ‘귀찮음’ 덕분에 고객을 묶어둘 수 있었고, 치열하게 경쟁할 필요성을 크게 느끼지 못했습니다.

    하지만 AI 비서가 이 모든 과정을 대신한다면 어떨까요? 고객들은 아주 사소한 가치 차이에도 즉시 더 나은 서비스로 이동할 것입니다. 고객 이동성은 극도로 높아지고, 은행이 누리던 초과 수익은 사라지게 됩니다.

     

    은행의 미래, ‘금고’ 혹은 ‘비서’

    결국 기존 은행들은 두 가지 선택의 기로에 서게 될 것입니다. 하나는 자본을 빌려주고 이자를 받는, 말 그대로 ‘거대한 대차대조표’ 즉, ‘금고’ 역할만 하는 것입니다. 이 분야는 완벽한 시장 경쟁에 가까워져 수익성이 크게 낮아질 것입니다.

    다른 하나는 고객에게 직접 가치를 제공하는 ‘디지털 금융 비서’가 되는 것입니다. 고객에게 중요한 것은 더 이상 바클레이스나 ING 같은 은행 이름이 아닙니다. 나에게 최고의 가치를 제안하는 ‘비서’ 그 자체가 중요해집니다.

     

    누가 이 전쟁에서 승리할까요?

    이 경쟁에는 크게 세 부류의 플레이어가 있습니다. 구글이나 아마존 같은 빅테크, 클라르나 같은 핀테크, 그리고 기존 은행입니다. 이 중 핀테크 기업들은 이미 은행 라이선스를 확보한 동시에, 현대적인 기술을 갖추고 있어 가장 유리한 고지에 있습니다.

    오래된 메인프레임 위에서 코볼(Cobol) 코드를 돌리는 기존 은행들과는 출발선이 다릅니다. 물론 일부 은행들은 혁신을 시도하고 있지만, 많은 은행이 2021년 핀테크의 가치가 잠시 주춤했을 때 너무 빨리 혁신을 포기해버렸습니다.

     

    AI는 정말 믿을 수 있을까요?

    물론 AI에 대한 신뢰 문제는 여전히 남아있습니다. 특히 대출 심사 같은 영역에서는 편향성이 개입될 위험이 있습니다. 클라르나 역시 대출 심사에는 아직 머신러닝 기술만을 사용하고, LLM(거대 언어 모델)은 사용하지 않습니다.

    하지만 다른 영역에서는 AI가 인간보다 뛰어난 일관성을 보여줍니다. 예를 들어 고객 분쟁 관리 업무가 그렇습니다. 판매자와 소비자에게서 증거를 수집하고 환불 여부를 결정하는 과정에서, AI는 지루함을 느끼는 인간보다 훨씬 더 일관되고 높은 품질의 결정을 내립니다.

     

    가장 솔직한, 일자리의 미래

    AI가 지식 노동을 대체할 것이라는 사실은 피할 수 없습니다. 이는 은행업뿐만 아니라 사회 전반에 걸친 거대한 변화입니다. 브뤼셀에는 8천 명의 번역가가 있지만, 이들의 업무 대부분은 이미 AI로 대체 가능합니다.

    클라르나는 실제로 지난 2년간 직원 1인당 수익을 2.5배 이상 늘렸습니다. 직원은 7,400명에서 3,000명으로 줄었지만, 이는 해고가 아닌 신규 채용을 중단하는 방식으로 이루어졌습니다. 회사는 절약된 인건비를 기존 직원들의 보상으로 재투자했고, 직원들은 AI를 활용해 더 높은 성과를 내고 더 큰 보상을 받게 되었습니다.

     

    결국은 ‘규모’입니다

    AI는 소프트웨어를 ‘제조’하는 비용을 0에 가깝게 만들고 있습니다. 똑똑한 개발자들이 한 줄 한 줄 입력하던 코드를 이제 기계가 순식간에 생성합니다. 이는 소프트웨어 기술로 얻을 수 있는 이익이 줄어든다는 뜻입니다.

    이런 환경에서 살아남는 방법은 ‘규모’입니다. 더 많은 고객에게 서비스를 제공하는 글로벌 기업이 되어야 합니다. 클라르나와 레볼루트 같은 기업들이 글로벌 시장을 목표로 하는 이유입니다. 전체 파이는 작아질 수 있지만, 그 파이의 더 큰 조각을 차지해야 합니다.

     

    변화를 마주하는 우리의 자세

    이 거대한 변화의 물결 앞에서 우리가 가져야 할 태도는 무엇일까요? 클라르나의 CEO는 엔지니어가 아님에도 불구하고 AI를 이용해 직접 코드를 탐색하고 배운다고 합니다. 그는 기술을 두려워하기보다, 적극적으로 배우고 활용하라고 조언합니다.

    AI가 만들어갈 금융의 미래는 이미 시작되었습니다. 두려워하기보다 무엇을 할 수 있는지 스스로 교육하고 알아보는 자세가 필요한 때입니다.

    출처: Bloomberg Technology 유튜브

     

  • AI 품질 불확실성을 잡는 법

    GPT를 프로덕트에 썼는데 왜 결과가 ‘들쑥날쑥’할까요?

    새로운 인공지능(AI) 기능 출시를 앞두고 밤낮없이 테스트를 진행했습니다. 그런데 막상 프로덕션 환경에 배포하고 나니, 예상치 못한 엉뚱한 결과가 튀어나오기 시작합니다. 이런 경험, AI 프로덕트를 개발하는 백엔드 서비스 기획자나 개발자라면 한 번쯤 겪어봤을 만한 흔한 시나리오입니다.

    왜 이런 일이 발생할까요? 기존 소프트웨어와 달리 대규모 언어 모델(LLM) 기반의 AI 애플리케이션은 결과가 비결정적입니다. 같은 질문을 던져도 매번 다른 답이 나올 수 있다는 뜻입니다. 단순히 코드를 수정하고 단위 테스트만으로는 품질을 담보하기 어렵습니다. 따라서 우리는 LLM의 예측 불가능한 특성을 제어할 수 있는 새로운 무기가 필요합니다. 그것이 바로 이밸(Evals, 평가)입니다.

    이밸은 AI 시스템이 얼마나 잘 작동하는지 체계적으로 점검하는 구조화된 테스트를 의미합니다. 품질, 신뢰성, 정확성 등 중요한 지표를 측정하도록 돕습니다. 많은 개발자가 이밸을 단순히 코드의 결함을 잡아내는 단위 테스트처럼 생각합니다.

    하지만 이밸은 그 이상의 가치를 지닙니다. 이밸은 문제가 생겼을 때 방어하는 수단을 넘어, 프로덕트 품질을 적극적으로 개선하는 ‘공격 무기’ 역할을 합니다. 이를 통해 우리는 프롬프트나 기반 모델을 변경했을 때, 성능이 나아지는지 혹은 나빠지는지를 정량적으로 판단할 수 있습니다.

    이밸을 구성하는 세 가지 핵심 요소

    이밸은 성공적인 AI 애플리케이션 개발에 필수적인 세 가지 핵심 재료로 구성됩니다. 이 재료들은 복잡한 AI 워크플로우를 체계적으로 평가할 수 있는 틀을 제공합니다. 개발자나 기획자는 이 세 요소를 정의하는 것에서부터 평가를 시작할 수 있습니다.

    첫째, 태스크(Task)는 평가하고자 하는 코드나 프롬프트를 의미합니다. 이는 사용자 질문에 답하는 단순한 프롬프트일 수도 있고, 여러 도구를 호출하는 복잡한 에이전트 워크플로우일 수도 있습니다. 중요한 것은 태스크가 명확한 입력(Input)과 출력(Output)을 요구한다는 점입니다.

    둘째, 데이터셋(Data Set)은 태스크를 실행할 때 사용하는 실제 세계의 테스트 사례 모음입니다. 이 데이터셋은 우리의 AI 애플리케이션이 실제 환경에서 어떻게 작동할지 예측하는 기반이 됩니다. 나중에 프로덕션에서 발생한 실제 사용자 로그를 이 데이터셋에 추가하여 품질을 향상시킬 수 있습니다.

    셋째, 스코어(Score)는 이밸의 핵심 로직입니다. 출력물이 얼마나 좋은지 객관적으로 측정하는 기준이 됩니다. 스코어는 LLM을 심판(Judge)으로 활용하여 출력의 우수성을 평가하게 하거나, 코드 기반의 휴리스틱(규칙 기반) 방식으로 정확도나 일치도를 측정할 수 있습니다.

    배포 전 ‘오프라인’과 배포 후 ‘온라인’ 평가

    이밸은 개발 단계와 운영 단계에 따라 오프라인 이밸과 온라인 이밸의 두 가지 방식으로 나뉩니다. 두 가지 방식 모두 성능을 개선하는 데 필수적인 역할을 합니다.

    오프라인 이밸은 프로덕션 배포 전에 문제를 파악하고 해결하는 반복 작업 단계입니다. 개발자는 이 단계에서 태스크와 스코어를 정의하고 테스트를 실행합니다. 너무 완벽한 데이터셋을 만들려고 하기보다는, 일단 작은 규모라도 기준점(Baseline)을 설정하고 반복적으로 개선해 나가는 것이 중요합니다.

    반면, 온라인 이밸은 애플리케이션이 실제 운영 환경에서 작동하는 동안 실시간으로 추적하는 것을 말합니다. 모델의 입력, 출력, 중간 단계, 도구 호출 등 모든 로그를 기록하여 라이브 트래픽에 대한 품질을 측정합니다. 이를 통해 지연 시간(Latency)이나 비용 같은 성능 지표까지 진단할 수 있습니다.

    사용자 피드백을 데이터셋으로 돌려주는 선순환 구조

    온라인 이밸은 단순 모니터링을 넘어, 피드백 선순환 구조(Flywheel Effect)를 완성하는 핵심입니다. 프로덕션 환경에서 수집된 로그는 다시 오프라인 이밸의 데이터셋을 보강하는 데 사용됩니다.

    이 과정에서 휴먼 인 더 루프(Human in the Loop)가 중요한 역할을 합니다. 사용자에게 직접 ‘좋아요/싫어요’ 같은 피드백을 받거나, 전문 인력이 로그를 검토하는 휴먼 리뷰를 진행할 수 있습니다. 예를 들어, 사용자 피드백이 ‘싫어요’인 로그만 필터링하여 검토한 후, 개선할 점을 테스트 케이스로 만들어 데이터셋에 추가합니다.

    결과적으로 이밸은 개발 단계부터 프로덕션까지 AI 애플리케이션의 품질을 측정하고 보장하는 유일한 방법입니다. 이러한 체계적인 평가 과정을 통해 개발팀은 예측 불가능한 LLM을 통제하고, 고객에게 더 신뢰할 수 있는 AI 경험을 제공할 수 있습니다.

    LLM 기반 프로덕트의 성공은 개발자의 직감이나 단순한 몇 번의 테스트만으로 보장되지 않습니다. 이밸은 LLM의 본질적인 비결정성을 극복하고 품질을 정량화할 수 있는 유일한 도구입니다. 오프라인 이밸로 신뢰의 기반을 다지고, 온라인 이밸과 휴먼 피드백을 통해 끊임없이 선순환 구조를 가동해야 합니다. 결국 잘 설계된 이밸이야말로, 우리 AI 프로덕트의 품질을 한 단계 끌어올리는 강력한 엔진이 될 것입니다.

    출처: AI Engineer 유튜브

     

     

  • 내 ‘성장 포트폴리오’의 현금 흐름, 왜 늘 막혀있을까?

    당신은 최고의 성장주 펀드에 투자했습니다. 하지만 막상 시장에 새로운 유망한 기회가 나타났을 때, 투자할 현금이 부족한 경험을 해본 적이 있지 않나요? 성장에 투자한 자본이 회수되기까지는 오랜 시간이 걸립니다. 바로 이 지점에서 기관 투자자들은 ‘현금 고갈 딜레마’라는 깊은 고민에 빠지곤 합니다. 지금처럼 거시 경제의 불확실성이 커진 시기에는 이 딜레마가 더욱 치명적으로 다가옵니다. 현금흐름 문제를 해결하고 성장 기회를 꾸준히 잡을 수 있는 혁신적인 포트폴리오 전략이 절실히 필요한 시점입니다.

     

    거시 경제의 압박과 일그러진 포트폴리오

    현재 금융 시장은 높은 기준 금리와 물가 상승이라는 거시 경제적 도전에 직면했습니다. 이러한 환경은 채무 상환 능력이 약한 기업들을 압박하며 신용 시장에 부실 채권의 증가를 예고합니다. 특히 과거 저금리 환경에서 과도하게 레버리지를 일으킨 기업들은 사업 모델을 재조정해야 합니다. 이에 따라 전문가들은 신용 시장이 오랜만에 ‘전통적인 부실 채권 주기’의 초입에 진입했다고 평가합니다.

     

    성장 투자자들의 현금 고갈 딜레마

    대다수 기관 투자자들은 사모펀드나 벤처 캐피탈 같은 비유동성 자산에 이미 많은 자본을 배분했습니다. 이러한 자산들은 장기적으로 높은 수익을 기대하지만, 자본이 회수되는 데는 시간이 오래 걸립니다. 금리가 상승하자 이들 비유동성 투자처의 수익률이 낮아지고 자본 회수 속도까지 느려지는 ‘이중고’에 직면했습니다. 결국 투자자들은 정작 다음에 나타날 잠재력 높은 펀드에 투자할 ‘실탄’이 부족해지는 상황에 놓입니다.

     

    틈새 신용 투자, 예상 밖의 현금 사다리

    이러한 현금 흐름 문제를 해결할 핵심 전략으로 ‘틈새 신용 투자(Opportunistic Credit)’가 떠오르고 있습니다. 이는 저평가되거나 부실에 빠진 자산에 투자하는 유연한 전략을 의미합니다. 틈새 신용 투자는 시장이 혼란스러울 때 좋은 성과를 내며 현금을 창출하는 능력이 뛰어납니다. 특히 성장주 투자나 벤처 캐피탈 투자와는 수익률의 상관관계가 낮습니다. 더 중요한 점은 이들 성장 투자와 현금 분배(Distributions)의 상관관계가 10% 미만으로 매우 낮다는 사실입니다. 이는 성장 투자처에서 현금이 잘 돌아오지 않는 시기에 틈새 신용 투자가 현금을 신속하게 회수해준다는 뜻입니다.

     

    기술적 분석: 부실 채권 시장의 새로운 기회

    최근 부실 채권 시장은 ‘부채 관리 교환(Liability Management Exercises, LMEs)’이 주도하고 있습니다. 이는 기업들이 대출 약정서의 허점을 이용하여 기존 부채의 할인 매입이나 새로운 자금 조달을 시도하는 행위를 말합니다. 백엔드 서비스 기획자라면, 이는 낮은 금리 환경에 맞춰 설계된 시스템(계약 구조)이 외부 환경(금리 인상) 변화로 인해 예상치 못한 방식으로 오용되는 상황으로 이해할 수 있습니다. 또한, 은행들이 시장 조성자(Market-Making) 역할을 축소하면서 대출 시장에 가격 비효율성이 발생하고 있습니다. 이러한 기술적이고 구조적인 복잡성은 숙련된 투자자에게 오히려 매력적인 매수 기회를 제공합니다.

    현금 흐름의 균형을 맞추는 전략적 도구

    틈새 신용 투자는 더 이상 단순히 위기 상황에 대비하는 방어적 전략이 아닙니다. 이는 성장 지향적인 포트폴리오의 지속 가능한 현금 흐름을 보장하는 전략적 보완 도구입니다. 높은 금리와 변동성이 장기화되는 시대에는 비유동성 투자에 대한 현금 고갈 딜레마를 해결해줄 포트폴리오의 구조적 안정성이 필수적입니다. 틈새 신용 투자를 통해 투자자들은 새로운 기회에 신속하게 자금을 투입할 수 있는 유연성을 확보하게 될 것입니다.

     

    출처: Goldman Sachs 유튜브

    Davidson Kempner Capital Management의 Tony Yoseloff가 거시 경제적 도전과 신용 투자 기회에 대해 논의하는 영상을 통해 더 깊은 통찰을 얻을 수 있습니다.

    Macro Challenges and Credit Opportunities: Davidson Kempner’s Tony Yoseloff