블로그

  • “내 옆자리 동료가 사라진다”: 버티컬 AI 에이전트가 만드는 SaaS 이후의 비즈니스

    요즘 기술의 발전 속도는 눈부실 정도입니다. 몇 달 전만 해도 챗봇 수준이던 AI가 이제는 팀 전체를 대체하는 수준으로 발전하고 있습니다. 우리가 매일 사용하는 수많은 소프트웨어(SaaS)가 실리콘밸리의 20년을 지배했다는 사실을 알고 계십니까? 그런데 이보다 10배 더 거대한 시장이 열리고 있다는 주장이 나옵니다. 이 새로운 물결의 핵심은 바로 ‘수직형 AI 에이전트’입니다. 이 변화가 우리의 일터와 비즈니스를 어떻게 바꿀지 지금부터 살펴보겠습니다.

    사스(SaaS) 시대의 막을 올린 의외의 주역

    사스(SaaS)가 어떻게 시작되었는지부터 이해해야 합니다. 지난 20년간 실리콘밸리 벤처 캐피탈의 40% 이상이 SaaS 기업에 투자되었습니다. 300개가 넘는 유니콘 기업이 이 카테고리에서 탄생했습니다. 이 거대한 흐름을 만든 숨겨진 기술적 촉매는 XML HTTP Request였습니다. 2004년, 웹 브라우저가 이 기능을 추가하면서 데스크톱 애플리케이션처럼 풍부한 사용자 경험을 웹에서도 구현할 수 있게 되었습니다. 이로써 소프트웨어는 CD-ROM 박스에서 웹사이트로 옮겨갔고, 구글 맵스나 지메일 같은 서비스가 등장했습니다.

    사스(SaaS) 시장을 스타트업이 점령한 이유

     클라우드와 모바일 시대가 열렸을 때, 모두가 예상한 대규모 소비자 시장은 결국 구글, 페이스북 같은 기존 거대 기업의 승리였습니다. 하지만 스타트업은 두 영역에서 승리했습니다. 하나는 에어비앤비나 우버처럼 아무도 예측하지 못한 소비자 대상 사업입니다. 다른 하나가 바로 B2B SaaS 영역이며, 여기서 가장 많은 유니콘이 탄생했습니다. 오라클이나 SAP 같은 대형 업체들이 모든 것을 포괄하는 솔루션을 제공했지만, 사용자 경험은 나빴습니다.

    인사 관리 전문 구스토(Gusto)의 경우처럼, 급여 정산 규제나 인사 시스템의 복잡한 뉘앙스를 거대 기업은 따라올 수 없었습니다. 해당 분야에 대한 깊은 이해(도메인 전문성)가 필요한 틈새시장을 수직형 SaaS가 파고들었습니다. 수백 개의 전문 분야를 깊이 이해하고 케어하는 것은 단일 기업으로는 불가능에 가까웠습니다.

    AI 에이전트가 사스보다 10배 크다고 평가받는 결정적 차이

     LLM(대규모 언어 모델)은 XML HTTP Request처럼 새로운 컴퓨팅 패러다임을 열었습니다. 사스 기업이 기존 박스형 소프트웨어를 대체했듯이, 이제 수직형 AI 에이전트는 사스 기업을 대체할 것입니다. 기존 사스 소프트웨어는 사용하기 위해 여전히 운영팀이나 인력을 필요로 했습니다.

    하지만 AI 에이전트는 소프트웨어와 인력을 하나로 통합합니다. 기업의 지출 중 소프트웨어 비용은 미미하지만, 인건비는 가장 큰 비중을 차지합니다. AI 에이전트는 반복적인 단순 데이터 입력이나 승인 작업 인력을 대체하며 비용 효율을 극대화합니다. 이 효율성 덕분에 수직형 AI 에이전트 시장은 기존 사스 시장보다 10배나 커질 수 있다는 분석이 나옵니다.

    동료의 반발을 피하고 성장하는 탑다운 판매 전략

     AI 에이전트를 도입하려는 스타트업은 새로운 과제에 직면합니다. 소프트웨어의 잠재적 고객이 곧 AI로 대체될 위협을 느끼는 직원일 수 있기 때문입니다. 따라서 판매 전략은 중요합니다. 제품 품질(QA) 테스트 자동화 기업의 경우를 생각해 봅시다. QA 팀에게 판매하면 반발에 부딪힐 수 있습니다.

    대신 이들은 엔지니어링 팀장이나 CEO를 대상으로 판매합니다. “이 제품이 QA 인력을 줄여줍니다”라고 솔직하게 말하는 것입니다. 이를 통해 당사자들의 저항 없이 대규모 도입을 이끌어내고 빠른 성장을 달성합니다. 개발자 지원 챗봇, 자동차 대출금 회수 전화 자동화 같은 사례 모두 해당 산업에 대한 깊은 이해가 기반입니다.

    천억 달러 유니콘을 만들 아이디어 찾는 법

    수직형 AI 에이전트의 기회를 찾는 공식은 의외로 간단합니다. 바로 ‘지루하고 반복적인 관리 업무’를 찾아내는 것입니다. 예를 들어, 한 스타트업은 정부 조달 웹사이트를 하루 종일 새로고침하며 입찰 공고를 찾던 친구의 업무를 AI 에이전트로 대체했습니다.

    다른 창업가는 치과 의사인 어머니의 진료 과정을 지켜보다가 복잡한 의료비 청구 과정을 AI로 자동화했습니다. 로봇공학에서 ‘더럽고 위험한 일’을 로봇이 담당하듯, AI 에이전트는 기업 내의 ‘지루한 버터 전달 업무(butter passing jobs)’를 맡게 될 것입니다. 본인이 가장 잘 아는 도메인에서 반복되는 고통스러운 작업을 찾아야 합니다.

    수직형 AI 에이전트는 단순한 소프트웨어 업그레이드를 넘어섭니다. 이는 비즈니스 운영 방식 전체를 혁신하는 근본적인 변화입니다. 이미 많은 기업이 10명의 인력만으로 수억 달러의 매출을 올릴 수 있는 모델을 구축하고 있습니다. 우리가 사는 세상은 이미 새로운 컴퓨팅 시대로 진입했습니다. 지금이 바로 이 새로운 물결에 올라타, 당신의 전문 분야에서 다음 ’10배’의 기회를 포착해야 할 때입니다.

     

    출처: Y Combinator 유튜브

  • 수많은 AI 툴 앞에서 길을 잃는 당신에게: ‘지휘자 AI’ 오케스트레이터 에이전트가 답인 이유

    매일매일 쏟아지는 업무 속에서 우리는 수많은 도구와 AI 서비스를 사용하고 있습니다. 하지만 단순한 하나의 작업을 처리하기 위해 여러 시스템 사이를 오가며 데이터를 옮기고 붙여넣는 일에 지치지는 않으셨나요? 흩어진 여러 도구들을 하나의 ‘신경 시스템’처럼 엮어내, 복잡한 업무를 스스로 완수하는 새로운 AI의 시대가 열리고 있습니다. 바로 이 모든 과정을 조율하는 핵심이 ‘오케스트레이터 에이전트’입니다. 이는 곧 당신의 비효율적인 업무 방식을 근본적으로 개선할 열쇠가 될 것입니다.

    오케스트레이터 에이전트: AI 도구들의 ‘신경 시스템’

    오케스트레이터 에이전트는 여러 AI 에이전트나 도구들의 작업을 총괄하고 감독하는 ‘지휘자’ 역할을 수행합니다. 이 에이전트 덕분에 다양한 보조 에이전트들이 협력하여 하나의 목표를 효율적으로 달성할 수 있습니다. 수많은 하위 에이전트와 도구들이 함께 움직이며 복잡한 작업을 처리할 때, 우리는 이것을 멀티 에이전트 시스템(Multi-Agent System, MAS)이라고 부릅니다. 오케스트레이터는 이 MAS의 효율적인 운영을 가능하게 하는 핵심 요소입니다.

     

    감사 노트 작성 요청, AI는 네 단계를 거칩니다

    우리가 오케스트레이터 에이전트에게 “최근 프로젝트를 도와준 팀원들에게 맞춤형 감사 노트를 작성해줘”라고 요청하는 상황을 가정해 봅시다.
    이 에이전트는 작업을 시작하기 전, 데이터 접근을 위한 API 연결과 업무 실행 순서를 먼저 정의합니다.
    이후 에이전트 선정, 워크플로우 조정, 데이터 공유, 지속적인 학습이라는 네 가지 핵심 단계를 순차적으로 실행합니다. 이 과정을 통해 요청 사항은 인간의 개입 없이 매끄럽게 완성됩니다.

     

    작업에 적합한 ‘최적의 동료’를 선택하는 방법

    가장 먼저 오케스트레이터는 작업에 필요한 최적의 에이전트와 도구를 카탈로그에서 신중하게 고릅니다. 감사 노트 작성이라는 임무를 위해, 오케스트레이터는 세 가지 시스템과의 협력을 결정할 수 있습니다. 이는 팀원 정보가 담긴 프로젝트 관리 시스템, 특정 톤으로 글을 쓰는 이메일 생성 에이전트, 그리고 사내 직원 감사 앱입니다. 올바른 도구를 선택하는 이 과정은 오케스트레이터가 작업을 효율적으로 진행하기 위한 첫걸음이 됩니다.

     

    API를 활용한 워크플로우의 ‘조율’과 ‘실행’

    에이전트 선정을 마친 오케스트레이터는 이제 전체 작업을 여러 하위 작업으로 쪼갭니다. 그리고 이를 적절한 에이전트나 도구에 할당하며 실행을 지시합니다. 오케스트레이터는 API를 통해 프로젝트 관리 시스템에 연결하여 프로젝트에 참여한 팀원 정보를 확인합니다. 이후 이메일 생성 에이전트를 활용해 원하는 톤과 스타일로 맞춤형 감사 메시지를 작성합니다. 마지막으로, 사내 앱을 통해 실제로 노트를 발송하도록 모든 과정을 조율합니다.

     

    이질적인 시스템을 연결하는 ‘USB-C 포트’: MCP

    여기서 만약 팀원 정보가 있는 시스템과 감사 노트를 생성하는 AI가 서로 다른 회사에서 만들었다면 어떻게 될까요? 이질적인 시스템들은 서로의 데이터 구조를 알지 못해 통신할 수 없습니다. 이 문제 해결의 핵심이 바로 **모델 컨텍스트 프로토콜(Model Context Protocol, MCP)**입니다. 이 기술은 AI 애플리케이션을 위한 ‘USB-C 포트’와 같아서, 서로 다른 제조사의 장치라도 표준화된 방식으로 연결합니다.

     

    MCP의 작동 원리: 모델, 컨텍스트, 프로토콜

    MCP를 통해 에이전트는 데이터의 저장 위치나 검색 방법을 알지 못해도 “X에 대한 정보를 줘”라고 요청할 수 있게 됩니다. 여기서 M은 에이전트의 중심에 있는 대규모 언어 모델(Model)을 의미합니다. C는 작업 수행에 필요한 문서나 검색 결과 등 모든 추가적인 정보(Context)를 통칭합니다. 마지막으로 P는 모델이 다양한 도구 및 데이터 소스와 상호 작용할 수 있도록 하는 표준화된 통신 방식(Protocol)입니다.

     

    작업의 완성: 산출물과 끊임없는 학습

    각 하위 에이전트는 작업을 실행한 후 그 정보를 오케스트레이터 에이전트에게 다시 보냅니다. 오케스트레이터는 이 결과를 하나로 묶어 ‘산출물(Artifact)’이라는 완성된 형태로 포장합니다. 최종적으로 오케스트레이터는 팀원들에게 멋지게 작성된 감사 노트를 전달하며 업무를 마무리합니다. 더 나아가, 이 에이전트는 완료된 작업을 되돌아보며 성능을 모니터링하고 다음번 작업을 위해 개선 사항을 반영하는 지속적인 학습 과정을 거치게 됩니다.

     

    오케스트레이터 에이전트를 활용한 멀티 에이전트 시스템은 단순한 자동화를 넘어섭니다. 이는 복잡하게 얽힌 업무 환경 속에서 AI가 스스로 생각하고, 협력하고, 개선하는 ‘똑똑한 자동화’의 미래를 제시합니다. 당신이 직접 여러 도구를 감독하는 대신, 이 ‘지휘자 에이전트’에게 일을 맡기고 더 중요한 핵심 업무에 집중해보세요.

    출처: IBM Technology 유튜브

     

  • AI 비서에게 10억 예산 결재를 맡긴다면? — 위험한 AI 행동을 막는 ‘휴먼 인 더 루프’ 미들웨어

    방금 AI 비서가 중요한 파트너에게 메일을 보냈다는 알림을 받았습니다. 하지만 메일 내용이 내가 의도했던 것과 완전히 다르다면 어떨까요?

    특히 AI 에이전트가 ‘실행력’을 갖게 될 때, 사용자의 불안감은 커질 수밖에 없습니다. 메일 발송이나 대규모 예산 승인처럼 한 번 실행되면 되돌릴 수 없는 행동을 AI가 하기 직전, 인간이 멈춰 세우고 확인해야 합니다.

    이러한 AI의 위험하거나 비싼 행동을 사전에 방지하는 것이 바로 ‘휴먼 인 더 루프(Human-in-the-Loop, HIL)’ 미들웨어의 핵심입니다. HIL은 AI의 효율성과 인간의 최종 통제력을 결합하는 필수적인 안전장치입니다.

     

    AI 에이전트의 기본적인 ‘실행 루프’

    AI 에이전트는 기본적으로 모델이 외부 도구를 호출하는 반복적인 작업을 수행합니다. 모델은 최종적인 응답을 사용자에게 전달하기 전까지 필요한 도구를 연쇄적으로 계속 실행합니다.
    예를 들어, 메일을 보내야 한다면 ‘메일 발송 도구(Send Email Tool)’를 호출하는 식입니다. HIL 미들웨어는 이 실행 루프의 중간에 인간의 개입 단계를 추가하여 안전성을 높입니다.

     

    비싸거나 위험한 도구 실행을 막는 방패

    HIL 미들웨어는 도구 실행이 실제 돈이 들거나(Expensive) 큰 비즈니스 리스크를 수반할 때 특히 유용합니다. 실제 결제가 일어나는 금융 API를 호출하거나, 대량의 고객 데이터를 삭제하는 등의 행위가 여기에 해당합니다. 미들웨어는 모델이 도구 호출을 결정하는 순간 그 실행을 잠시 멈춥니다. 그 후 인간 사용자의 최종적인 피드백을 받고 나서야 실제 도구 실행을 조건부로 재개합니다.

     

    HIL 미들웨어가 제공하는 세 가지 의사결정 방식

    HIL은 단순한 ‘실행 또는 중지’를 넘어 세밀한 인간의 통제를 지원합니다. 사용자가 AI의 잠재적 행동에 대해 내릴 수 있는 가장 일반적인 세 가지 의사결정 방식이 있습니다.

    첫째, 승인(Approval)은 AI가 작성한 내용(예: 메일 초안)을 검토한 후 이상이 없다고 판단할 때 사용합니다. 초안은 작성된 그대로 최종 발송이 진행됩니다.
    둘째, 수정(Edit)은 AI의 초안에 수신자 변경이나 문구 수정과 같은 부분적인 편집이 필요할 때 사용합니다. 수정된 내용을 바탕으로 도구 실행이 즉시 재개됩니다.
    셋째, 거부(Rejection)는 AI의 초안을 완전히 거부하고 모델에게 왜 다시 작성해야 하는지 피드백 메시지를 제공할 때 선택합니다.

     

    100만 달러 예산 승인 사례로 본 안전장치 작동

    예를 들어, AI 에이전트에게 100만 달러(약 10억 원) 규모의 분기 예산 승인 메일을 파트너에게 작성하도록 요청하는 상황을 가정해 봅시다. AI는 “검토 후 승인했습니다”는 내용으로 메일 초안을 만들고 이를 발송 도구에 전달합니다.

    이때 HIL 미들웨어가 즉시 개입하여 실행을 가로챕니다. 만약 성급한 승인이 부담된다면, 사용자는 ‘수정’ 옵션을 선택하여 “제안을 상세 검토 중입니다. 곧 최종 확정본을 보내드리겠습니다”라는 신중한 문구로 직접 변경하여 발송할 수 있습니다.

    혹은 ‘거부’ 옵션으로 “세부 제안 내용에 대한 더 많은 정보가 필요합니다”라는 메시지를 모델에 되돌려 보냅니다. 모델은 이 피드백을 학습하여 메일 초안을 개정하고, 개정된 초안은 다시 HIL 미들웨어를 거쳐 최종 승인을 기다리게 됩니다.

    HIL 미들웨어는 AI 에이전트가 복잡하고 민감한 비즈니스 로직을 수행하는 환경에서 인간의 통제력을 유지하는 핵심 기술입니다. 우리는 AI에게 업무를 위임하는 동시에, 최종적인 책임과 판단을 놓치지 않는 균형 잡힌 시스템을 구축해야 합니다.

     

    출처: LangChain 유튜브

     

  • 엘리븐랩스 CEO가 말하는 ‘음성 인터페이스’ 혁신

    다음 세대 AI는 왜 인간의 감정을 이해해야 하는가? 엘리븐랩스 CEO가 말하는 ‘음성 인터페이스’ 혁신

    혹시 해외 영화를 볼 때 어색한 한국어 더빙 때문에 몰입이 깨진 경험이 있으신가요? 혹은 AI 스피커에게 말을 걸 때, 감정 없는 모노톤의 답변에 답답함을 느낀 적은 없으신가요? 기술이 발전했음에도 불구하고, 여전히 우리가 마주하는 AI 음성은 차갑고 기계적입니다.

    우리의 일상 대화는 단순한 단어 전달이 아닌, 감정과 뉘앙스가 담긴 복잡한 경험입니다. 그리고 바로 이 지점, ‘인간의 감정을 포착하는 음성 AI’에 집중하여 폭발적으로 성장한 기업이 있습니다. 바로 엘리븐랩스(ElevenLabs)입니다. 엘리븐랩스의 CEO인 마티 스타니셰프스키(Mati Staniszewski)가 말하는 다음 세대 AI 인터페이스의 혁신 전략을 깊이 들여다봅니다.

     

    감정을 이해하는 음성 합성: AI의 새로운 문맥 이해 능력

    엘리븐랩스가 처음 해결하고자 했던 문제는 ‘문맥’이었습니다. 기존의 음성 합성(Text-to-Speech) 모델은 단지 텍스트를 소리로 변환하는 역할에 머물렀습니다. 하지만 엘리븐랩스는 단순히 텍스트를 읽는 것을 넘어섭니다.

    이들의 모델은 문장이 담고 있는 감정과 억양, 맥락을 이해하고 목소리에 반영합니다. 나이, 성별, 특정 지역의 억양과 같은 미세한 목소리 특성까지 포착하여 구현해냅니다. 이 핵심 기술을 바탕으로 엘리븐랩스는 텍스트-음성 변환뿐만 아니라 음성-텍스트, 그리고 AI 에이전트 플랫폼까지 영역을 확장하고 있습니다.

     

    속도를 위한 결단: 연구와 제품 사이의 3개월 규칙

    기술 스타트업이 마주하는 가장 어려운 숙제는 연구(R&D)의 완성도와 제품(Product) 출시 속도의 균형을 맞추는 일입니다. 엘리븐랩스 역시 이 딜레마를 피해 갈 수 없었습니다. 초기에는 고객들이 음성 속도를 조절하는 슬라이더 기능을 요구했습니다.

    하지만 CEO는 단순한 편집 기능을 추가하기보다는 연구 단계에서 음성 속도를 완벽하게 해결하려 했습니다. 결국 9개월 동안 연구팀은 이 문제를 풀지 못했고, 그 사이에 제품팀이 간단한 슬라이더 기능을 출시했습니다. 이 경험을 통해 엘리븐랩스는 중요한 교훈을 얻었습니다. 만약 연구 해결에 3개월 이상이 걸릴 것이 예상되면, 제품팀은 즉시 사용자에게 필요한 임시 기능이라도 출시하여 시장의 피드백을 받기로 결정했습니다.

     

    전권을 부여한 소규모 팀과 타이틀 없는 조직 문화

    엘리븐랩스는 조직 구조에서도 독특한 방식을 고수합니다. 현재 5명에서 10명 규모의 소규모 제품팀 약 20개가 운영되고 있습니다. 각 팀에게는 제품 출시에 대한 완전한 독립성과 전권이 부여됩니다.

    이러한 방식은 중복된 작업을 발생시키기도 하지만, 팀원 개개인의 오너십을 극도로 높이는 결과를 가져왔습니다. 또한, 엘리븐랩스는 1년 전부터 직위(Title)를 없앴습니다. 팀에 합류한 지 얼마 되지 않았더라도, 뛰어난 능력과 열정을 보여주면 연차에 상관없이 빠르게 영향력을 발휘할 수 있습니다.

     

    창작 생태계와의 상생: 보이스 마켓플레이스 전략

    AI가 등장했을 때, 창작자들 사이에서는 일자리를 위협하는 기술이라는 부정적인 반응이 많았습니다. 엘리븐랩스는 이러한 초기 반발을 피하고 산업과 함께 성장하는 전략을 택했습니다. 이들이 출시한 서비스가 바로 ‘보이스 마켓플레이스’입니다.

    성우나 일반 사용자는 자신의 목소리를 공유하고, 해당 목소리가 사용될 때마다 수익을 분배받습니다. 현재까지 약 1만 개의 목소리가 등록되었고, 커뮤니티에 100억 원 이상의 수익이 지급되었습니다. 이 전략은 AI가 일방적으로 산업을 파괴하는 것이 아니라, 오히려 새로운 수익 창출 기회를 제공할 수 있음을 입증했습니다.

     

    기업 전환의 핵심: 인센티브 설계

    엘리븐랩스는 개인 사용자 중심의 PLG(Product-Led Growth) 모델로 시작했지만, 결국 엔터프라이즈(기업) 시장으로 진출했습니다. 기업 고객을 유치하는 과정은 단순히 제품이 좋은 것을 넘어섭니다. 보안, 규정 준수, 그리고 99.99% 이상의 고가용성을 갖춘 인프라 구축이 필수적입니다.

    특히 흥미로운 점은 기업 영업팀의 인센티브(성과급) 설계에 대한 CEO의 통찰입니다. 조직이 커지면서 인센티브 구조는 결국 회사의 전략을 결정하는 ‘후행 지표’가 됩니다. CEO는 영업팀에게 인센티브를 포기하더라도, 장기적인 회사 전략에 해가 되는 딜(예: 경쟁사에 핵심 모델을 판매하는 행위)은 스스로 거절하도록 독려했습니다. 이처럼 인센티브와 전략을 일치시키는 것이 대규모 조직을 이끄는 핵심입니다.

    엘리븐랩스의 이야기는 단순히 목소리 기술의 발전사를 넘어, 급변하는 AI 시대에 기업이 어떻게 문화, 조직 구조, 그리고 시장 전략을 동시에 혁신해야 하는지를 보여줍니다. 인간의 감정을 이해하는 AI를 만들겠다는 목표처럼, 그들의 경영 방식 또한 인간적인 연결과 오너십을 기반으로 하고 있습니다.

    출처: a16z 유튜브

     

  • 왜 우리의 AI 앱은 데모에서만 완벽할까?

    멋진 AI 데모를 보고 감탄한 경험, 다들 한 번쯤 있죠. 하지만 막상 우리가 만든 AI 제품을 출시하면, 예상치 못한 곳에서 문제가 터지곤 합니다. 분명히 테스트할 땐 완벽했는데, 왜 이런 일이 생길까요? 이 글은 AI 앱의 품질을 ‘진짜로’ 측정하고 개선하는 법에 대한 이야기입니다.

     

    테스트를 통과한 ‘과일 글자 수 세기’ 앱

    여기 ‘과일 글자 수 세기’라는 간단한 앱이 있습니다. 말 그대로 과일 이름의 글자 수를 세어주는 AI 앱입니다. ‘apple’을 입력하니 ‘5’이라고 정확히 답했습니다. 두 번이나 테스트에 성공했고, 저희는 자신 있게 제품을 출시했습니다.

     

    “딸기에 R이 2개라는데요?”

    하지만 출시 직후, ‘존’이라는 이름의 사용자에게서 트윗이 날아왔습니다. “딸기(Strawberry)에 R이 몇 개냐고 물었더니 2개라고 답했어요.” AI 모델은 본질적으로 신뢰하기 어렵습니다. 데모에서는 멋져 보이지만, 실제 운영 환경에서는 환각(Hallucination)이 우리를 기다립니다.

     

    프롬프트 엔지니어링, 10번의 성공, 그리고 또다시 실패

    우리는 포기하지 않고 프롬프트를 개선하기 위해 밤을 새웠습니다. “활기 넘치는 과일 애호가 AI…”로 시작하는 멋진 프롬프트를 만들었습니다. 이번엔 같은 질문으로 10번 연속 테스트했고, 10번 모두 성공했습니다.

    하지만 존은 다시 나타났습니다. 그는 이번에 “딸기, 바나나, 파인애플, 망고…” 등 긴 과일 목록을 한꺼번에 질문했습니다. 사용자는 우리가 상상하지 못한 방식으로 앱을 사용합니다. 앱의 로그인, UI 등 95%가 완벽해도, 가장 치명적인 5%의 AI 로직이 실패할 수 있습니다.

     

    해답은 ‘농구 코트’에 있습니다

    여기서 바로 ‘이밸(Eval)’, 즉 AI 평가의 개념이 등장합니다. 이를 설명하기 위해 농구 코트 비유를 들어보겠습니다. 골대는 ‘정답’, 농구공을 던지는 행위는 ‘사용자 질문(Task)’입니다. 슛이 성공하면 ‘파란색 점(성공)’, 실패하면 ‘빨간색 점(실패)’입니다.

     

    우리 앱의 ‘코트’는 어떻게 생겼을까?

    좋은 이밸을 만들려면, 먼저 우리 앱의 ‘코트’를 이해해야 합니다. “딸기에 R이 몇 개?”처럼 쉬운 질문은 골대와 가까운 ‘파란 점’일 것입니다. 존의 긴 과일 목록 질문은 골대에서 아주 먼 ‘빨간 점’이겠죠.

    이 ‘코트’를 그릴 때 흔히 빠지는 함정이 있습니다. 첫째, ‘코트 밖(out-of-bounds)’ 질문에 시간을 낭비하는 것입니다. ‘당근의 음절은 몇 개?’ 같은 질문은 우리 앱의 영역이 아니죠. 둘째, 골대 앞 쉬운 질문만 테스트하는 것입니다. 코트의 경계를 명확히 알고, 구석구석 모든 영역을 테스트해야 합니다.

     

    사용자 데이터 수집, 지름길은 없습니다

    이 빨간 점과 파란 점들은 어떻게 수집할까요? 사용자의 ‘좋아요/싫어요’ 피드백은 훌륭한 신호가 될 수 있습니다. 꾸준히 로그를 살피며 무작위 샘플을 확인하는 것도 좋은 방법입니다.

    커뮤니티 포럼이나 트위터에서 사용자의 실제 불만을 직접 파악할 수도 있습니다. 안타깝게도 이 ‘코트’를 이해하는 작업에는 지름길이 없습니다. 제대로 된 데이터셋을 구축하면, 우리 시스템이 코트의 ‘우측 하단’에서 유독 약하다는 식의 명확한 진단을 내릴 수 있습니다.

     

    이밸은 유닛 테스트가 아닙니다

    이밸은 유닛 테스트와 근본적으로 다릅니다. 이밸은 ‘실전 연습’에 가깝습니다. “딸기에 R이 몇 개?” 같은 ‘데이터(질문)’는 상수로 고정합니다.

    우리가 실제로 바꾸며 테스트할 것은 ‘태스크(변수)’입니다. 예를 들어, 새로운 시스템 프롬프트나 RAG 설정을 이 변수에 넣고 테스트합니다. 이렇게 하면, 연습(이밸)이 실전(운영)과 거의 동일한 코드를 공유하게 되어 매우 효율적입니다.

     

    점수 매기기, 단순할수록 좋습니다

    마지막 단계는 이 슛이 성공했는지 ‘점수’를 매기는 것입니다. 이 점수 시스템은 가능한 한 ‘결정론적(deterministic)’이고 ‘성공/실패’로 명확해야 합니다. 점수판이 복잡하면 무엇이 잘못됐는지 디버깅하기가 극도로 어려워집니다.

    스스로에게 “이 테스트가 실패했다는 것을 알려면 무엇을 확인해야 하지?”라고 질문해 보세요. 때로는 이밸 전용 프롬프트에 <answer> 같은 태그를 추가해, 점수 매기기(스트링 매칭)를 더 쉽게 만드는 트릭을 쓸 수도 있습니다. 정 코드로 만들기 어렵다면, 사람이 직접 리뷰하는 것도 괜찮습니다.

     

    측정이 없으면, 개선도 없습니다

    이밸 시스템을 CI(지속적 통합)에 연결하는 것을 적극 권장합니다. 동료가 프롬프트를 수정한 PR을 올렸을 때, 이 변경이 코트의 한쪽을 고쳤지만 다른 쪽을 망가뜨렸는지 바로 알 수 있습니다. “측정 없는 개선은 제한적이고 부정확합니다.”

    이밸은 우리에게 시스템을 체계적으로 개선할 수 있는 ‘명확성’을 줍니다. 이는 더 높은 신뢰도, 더 높은 품질로 이어집니다. 결국 고객 지원에 쏟는 시간을 줄이고, 더 나은 사용자 경험을 만드는 선순환을 만들게 될 것입니다.

    출처: AI Engineer 유튜브

     

  • AI가 내 은행 계좌를 관리하는 날

    매달 나가는 대출 이자나 카드 값을 보며 ‘이게 정말 최선일까?’ 고민해본 적 있으신가요? 더 좋은 조건이 어딘가 있을 것 같은데, 일일이 찾아보고 서류를 준비할 생각을 하면 눈앞이 깜깜해집니다.

    만약 나도 모르는 사이, 인공지능 비서가 내 모든 금융 상품을 분석해 더 저렴한 대출로 갈아타고, 이 과정을 전부 자동으로 처리해 준다면 어떨까요? 공상 과학 영화 이야기가 아닙니다. 우리가 모르는 사이, AI는 은행 산업의 지도를 완전히 새로 그리고 있습니다.

     

    내 돈을 지켜주는 진짜 비서

    클라르나(Klarna)의 CEO는 10년 전부터 이런 미래를 꿈꿨습니다. 바로 ‘디지털 금융 비서’입니다. 이 비서는 단순히 지출을 요약해 주는 가계부가 아닙니다. 내 주택담보대출 금리가 너무 높다고 판단하면, 즉시 더 좋은 조건을 찾아냅니다.

    “더 나은 제안을 찾았습니다. ‘예’라고만 하시면 모든 서류 작업을 대신 처리해 드릴게요.”

    마치 자율주행차가 언젠가 도로를 가득 메울 것을 알지만 그 시점은 정확히 모르듯, 금융 비서의 등장도 마찬가지입니다. 이는 은행 산업에 거대한 변화를 예고합니다.

     

    은행이 더 이상 ‘갑’이 아니게 될 때

    지금까지 우리는 은행을 바꾸는 것을 매우 어렵고 귀찮은 일로 여겼습니다. 데이터를 옮기고 서류를 챙기는 과정이 복잡하기 때문입니다. 은행들은 이 ‘귀찮음’ 덕분에 고객을 묶어둘 수 있었고, 치열하게 경쟁할 필요성을 크게 느끼지 못했습니다.

    하지만 AI 비서가 이 모든 과정을 대신한다면 어떨까요? 고객들은 아주 사소한 가치 차이에도 즉시 더 나은 서비스로 이동할 것입니다. 고객 이동성은 극도로 높아지고, 은행이 누리던 초과 수익은 사라지게 됩니다.

     

    은행의 미래, ‘금고’ 혹은 ‘비서’

    결국 기존 은행들은 두 가지 선택의 기로에 서게 될 것입니다. 하나는 자본을 빌려주고 이자를 받는, 말 그대로 ‘거대한 대차대조표’ 즉, ‘금고’ 역할만 하는 것입니다. 이 분야는 완벽한 시장 경쟁에 가까워져 수익성이 크게 낮아질 것입니다.

    다른 하나는 고객에게 직접 가치를 제공하는 ‘디지털 금융 비서’가 되는 것입니다. 고객에게 중요한 것은 더 이상 바클레이스나 ING 같은 은행 이름이 아닙니다. 나에게 최고의 가치를 제안하는 ‘비서’ 그 자체가 중요해집니다.

     

    누가 이 전쟁에서 승리할까요?

    이 경쟁에는 크게 세 부류의 플레이어가 있습니다. 구글이나 아마존 같은 빅테크, 클라르나 같은 핀테크, 그리고 기존 은행입니다. 이 중 핀테크 기업들은 이미 은행 라이선스를 확보한 동시에, 현대적인 기술을 갖추고 있어 가장 유리한 고지에 있습니다.

    오래된 메인프레임 위에서 코볼(Cobol) 코드를 돌리는 기존 은행들과는 출발선이 다릅니다. 물론 일부 은행들은 혁신을 시도하고 있지만, 많은 은행이 2021년 핀테크의 가치가 잠시 주춤했을 때 너무 빨리 혁신을 포기해버렸습니다.

     

    AI는 정말 믿을 수 있을까요?

    물론 AI에 대한 신뢰 문제는 여전히 남아있습니다. 특히 대출 심사 같은 영역에서는 편향성이 개입될 위험이 있습니다. 클라르나 역시 대출 심사에는 아직 머신러닝 기술만을 사용하고, LLM(거대 언어 모델)은 사용하지 않습니다.

    하지만 다른 영역에서는 AI가 인간보다 뛰어난 일관성을 보여줍니다. 예를 들어 고객 분쟁 관리 업무가 그렇습니다. 판매자와 소비자에게서 증거를 수집하고 환불 여부를 결정하는 과정에서, AI는 지루함을 느끼는 인간보다 훨씬 더 일관되고 높은 품질의 결정을 내립니다.

     

    가장 솔직한, 일자리의 미래

    AI가 지식 노동을 대체할 것이라는 사실은 피할 수 없습니다. 이는 은행업뿐만 아니라 사회 전반에 걸친 거대한 변화입니다. 브뤼셀에는 8천 명의 번역가가 있지만, 이들의 업무 대부분은 이미 AI로 대체 가능합니다.

    클라르나는 실제로 지난 2년간 직원 1인당 수익을 2.5배 이상 늘렸습니다. 직원은 7,400명에서 3,000명으로 줄었지만, 이는 해고가 아닌 신규 채용을 중단하는 방식으로 이루어졌습니다. 회사는 절약된 인건비를 기존 직원들의 보상으로 재투자했고, 직원들은 AI를 활용해 더 높은 성과를 내고 더 큰 보상을 받게 되었습니다.

     

    결국은 ‘규모’입니다

    AI는 소프트웨어를 ‘제조’하는 비용을 0에 가깝게 만들고 있습니다. 똑똑한 개발자들이 한 줄 한 줄 입력하던 코드를 이제 기계가 순식간에 생성합니다. 이는 소프트웨어 기술로 얻을 수 있는 이익이 줄어든다는 뜻입니다.

    이런 환경에서 살아남는 방법은 ‘규모’입니다. 더 많은 고객에게 서비스를 제공하는 글로벌 기업이 되어야 합니다. 클라르나와 레볼루트 같은 기업들이 글로벌 시장을 목표로 하는 이유입니다. 전체 파이는 작아질 수 있지만, 그 파이의 더 큰 조각을 차지해야 합니다.

     

    변화를 마주하는 우리의 자세

    이 거대한 변화의 물결 앞에서 우리가 가져야 할 태도는 무엇일까요? 클라르나의 CEO는 엔지니어가 아님에도 불구하고 AI를 이용해 직접 코드를 탐색하고 배운다고 합니다. 그는 기술을 두려워하기보다, 적극적으로 배우고 활용하라고 조언합니다.

    AI가 만들어갈 금융의 미래는 이미 시작되었습니다. 두려워하기보다 무엇을 할 수 있는지 스스로 교육하고 알아보는 자세가 필요한 때입니다.

    출처: Bloomberg Technology 유튜브

     

  • AI 품질 불확실성을 잡는 법

    GPT를 프로덕트에 썼는데 왜 결과가 ‘들쑥날쑥’할까요?

    새로운 인공지능(AI) 기능 출시를 앞두고 밤낮없이 테스트를 진행했습니다. 그런데 막상 프로덕션 환경에 배포하고 나니, 예상치 못한 엉뚱한 결과가 튀어나오기 시작합니다. 이런 경험, AI 프로덕트를 개발하는 백엔드 서비스 기획자나 개발자라면 한 번쯤 겪어봤을 만한 흔한 시나리오입니다.

    왜 이런 일이 발생할까요? 기존 소프트웨어와 달리 대규모 언어 모델(LLM) 기반의 AI 애플리케이션은 결과가 비결정적입니다. 같은 질문을 던져도 매번 다른 답이 나올 수 있다는 뜻입니다. 단순히 코드를 수정하고 단위 테스트만으로는 품질을 담보하기 어렵습니다. 따라서 우리는 LLM의 예측 불가능한 특성을 제어할 수 있는 새로운 무기가 필요합니다. 그것이 바로 이밸(Evals, 평가)입니다.

    이밸은 AI 시스템이 얼마나 잘 작동하는지 체계적으로 점검하는 구조화된 테스트를 의미합니다. 품질, 신뢰성, 정확성 등 중요한 지표를 측정하도록 돕습니다. 많은 개발자가 이밸을 단순히 코드의 결함을 잡아내는 단위 테스트처럼 생각합니다.

    하지만 이밸은 그 이상의 가치를 지닙니다. 이밸은 문제가 생겼을 때 방어하는 수단을 넘어, 프로덕트 품질을 적극적으로 개선하는 ‘공격 무기’ 역할을 합니다. 이를 통해 우리는 프롬프트나 기반 모델을 변경했을 때, 성능이 나아지는지 혹은 나빠지는지를 정량적으로 판단할 수 있습니다.

    이밸을 구성하는 세 가지 핵심 요소

    이밸은 성공적인 AI 애플리케이션 개발에 필수적인 세 가지 핵심 재료로 구성됩니다. 이 재료들은 복잡한 AI 워크플로우를 체계적으로 평가할 수 있는 틀을 제공합니다. 개발자나 기획자는 이 세 요소를 정의하는 것에서부터 평가를 시작할 수 있습니다.

    첫째, 태스크(Task)는 평가하고자 하는 코드나 프롬프트를 의미합니다. 이는 사용자 질문에 답하는 단순한 프롬프트일 수도 있고, 여러 도구를 호출하는 복잡한 에이전트 워크플로우일 수도 있습니다. 중요한 것은 태스크가 명확한 입력(Input)과 출력(Output)을 요구한다는 점입니다.

    둘째, 데이터셋(Data Set)은 태스크를 실행할 때 사용하는 실제 세계의 테스트 사례 모음입니다. 이 데이터셋은 우리의 AI 애플리케이션이 실제 환경에서 어떻게 작동할지 예측하는 기반이 됩니다. 나중에 프로덕션에서 발생한 실제 사용자 로그를 이 데이터셋에 추가하여 품질을 향상시킬 수 있습니다.

    셋째, 스코어(Score)는 이밸의 핵심 로직입니다. 출력물이 얼마나 좋은지 객관적으로 측정하는 기준이 됩니다. 스코어는 LLM을 심판(Judge)으로 활용하여 출력의 우수성을 평가하게 하거나, 코드 기반의 휴리스틱(규칙 기반) 방식으로 정확도나 일치도를 측정할 수 있습니다.

    배포 전 ‘오프라인’과 배포 후 ‘온라인’ 평가

    이밸은 개발 단계와 운영 단계에 따라 오프라인 이밸과 온라인 이밸의 두 가지 방식으로 나뉩니다. 두 가지 방식 모두 성능을 개선하는 데 필수적인 역할을 합니다.

    오프라인 이밸은 프로덕션 배포 전에 문제를 파악하고 해결하는 반복 작업 단계입니다. 개발자는 이 단계에서 태스크와 스코어를 정의하고 테스트를 실행합니다. 너무 완벽한 데이터셋을 만들려고 하기보다는, 일단 작은 규모라도 기준점(Baseline)을 설정하고 반복적으로 개선해 나가는 것이 중요합니다.

    반면, 온라인 이밸은 애플리케이션이 실제 운영 환경에서 작동하는 동안 실시간으로 추적하는 것을 말합니다. 모델의 입력, 출력, 중간 단계, 도구 호출 등 모든 로그를 기록하여 라이브 트래픽에 대한 품질을 측정합니다. 이를 통해 지연 시간(Latency)이나 비용 같은 성능 지표까지 진단할 수 있습니다.

    사용자 피드백을 데이터셋으로 돌려주는 선순환 구조

    온라인 이밸은 단순 모니터링을 넘어, 피드백 선순환 구조(Flywheel Effect)를 완성하는 핵심입니다. 프로덕션 환경에서 수집된 로그는 다시 오프라인 이밸의 데이터셋을 보강하는 데 사용됩니다.

    이 과정에서 휴먼 인 더 루프(Human in the Loop)가 중요한 역할을 합니다. 사용자에게 직접 ‘좋아요/싫어요’ 같은 피드백을 받거나, 전문 인력이 로그를 검토하는 휴먼 리뷰를 진행할 수 있습니다. 예를 들어, 사용자 피드백이 ‘싫어요’인 로그만 필터링하여 검토한 후, 개선할 점을 테스트 케이스로 만들어 데이터셋에 추가합니다.

    결과적으로 이밸은 개발 단계부터 프로덕션까지 AI 애플리케이션의 품질을 측정하고 보장하는 유일한 방법입니다. 이러한 체계적인 평가 과정을 통해 개발팀은 예측 불가능한 LLM을 통제하고, 고객에게 더 신뢰할 수 있는 AI 경험을 제공할 수 있습니다.

    LLM 기반 프로덕트의 성공은 개발자의 직감이나 단순한 몇 번의 테스트만으로 보장되지 않습니다. 이밸은 LLM의 본질적인 비결정성을 극복하고 품질을 정량화할 수 있는 유일한 도구입니다. 오프라인 이밸로 신뢰의 기반을 다지고, 온라인 이밸과 휴먼 피드백을 통해 끊임없이 선순환 구조를 가동해야 합니다. 결국 잘 설계된 이밸이야말로, 우리 AI 프로덕트의 품질을 한 단계 끌어올리는 강력한 엔진이 될 것입니다.

    출처: AI Engineer 유튜브

     

     

  • 내 ‘성장 포트폴리오’의 현금 흐름, 왜 늘 막혀있을까?

    당신은 최고의 성장주 펀드에 투자했습니다. 하지만 막상 시장에 새로운 유망한 기회가 나타났을 때, 투자할 현금이 부족한 경험을 해본 적이 있지 않나요? 성장에 투자한 자본이 회수되기까지는 오랜 시간이 걸립니다. 바로 이 지점에서 기관 투자자들은 ‘현금 고갈 딜레마’라는 깊은 고민에 빠지곤 합니다. 지금처럼 거시 경제의 불확실성이 커진 시기에는 이 딜레마가 더욱 치명적으로 다가옵니다. 현금흐름 문제를 해결하고 성장 기회를 꾸준히 잡을 수 있는 혁신적인 포트폴리오 전략이 절실히 필요한 시점입니다.

     

    거시 경제의 압박과 일그러진 포트폴리오

    현재 금융 시장은 높은 기준 금리와 물가 상승이라는 거시 경제적 도전에 직면했습니다. 이러한 환경은 채무 상환 능력이 약한 기업들을 압박하며 신용 시장에 부실 채권의 증가를 예고합니다. 특히 과거 저금리 환경에서 과도하게 레버리지를 일으킨 기업들은 사업 모델을 재조정해야 합니다. 이에 따라 전문가들은 신용 시장이 오랜만에 ‘전통적인 부실 채권 주기’의 초입에 진입했다고 평가합니다.

     

    성장 투자자들의 현금 고갈 딜레마

    대다수 기관 투자자들은 사모펀드나 벤처 캐피탈 같은 비유동성 자산에 이미 많은 자본을 배분했습니다. 이러한 자산들은 장기적으로 높은 수익을 기대하지만, 자본이 회수되는 데는 시간이 오래 걸립니다. 금리가 상승하자 이들 비유동성 투자처의 수익률이 낮아지고 자본 회수 속도까지 느려지는 ‘이중고’에 직면했습니다. 결국 투자자들은 정작 다음에 나타날 잠재력 높은 펀드에 투자할 ‘실탄’이 부족해지는 상황에 놓입니다.

     

    틈새 신용 투자, 예상 밖의 현금 사다리

    이러한 현금 흐름 문제를 해결할 핵심 전략으로 ‘틈새 신용 투자(Opportunistic Credit)’가 떠오르고 있습니다. 이는 저평가되거나 부실에 빠진 자산에 투자하는 유연한 전략을 의미합니다. 틈새 신용 투자는 시장이 혼란스러울 때 좋은 성과를 내며 현금을 창출하는 능력이 뛰어납니다. 특히 성장주 투자나 벤처 캐피탈 투자와는 수익률의 상관관계가 낮습니다. 더 중요한 점은 이들 성장 투자와 현금 분배(Distributions)의 상관관계가 10% 미만으로 매우 낮다는 사실입니다. 이는 성장 투자처에서 현금이 잘 돌아오지 않는 시기에 틈새 신용 투자가 현금을 신속하게 회수해준다는 뜻입니다.

     

    기술적 분석: 부실 채권 시장의 새로운 기회

    최근 부실 채권 시장은 ‘부채 관리 교환(Liability Management Exercises, LMEs)’이 주도하고 있습니다. 이는 기업들이 대출 약정서의 허점을 이용하여 기존 부채의 할인 매입이나 새로운 자금 조달을 시도하는 행위를 말합니다. 백엔드 서비스 기획자라면, 이는 낮은 금리 환경에 맞춰 설계된 시스템(계약 구조)이 외부 환경(금리 인상) 변화로 인해 예상치 못한 방식으로 오용되는 상황으로 이해할 수 있습니다. 또한, 은행들이 시장 조성자(Market-Making) 역할을 축소하면서 대출 시장에 가격 비효율성이 발생하고 있습니다. 이러한 기술적이고 구조적인 복잡성은 숙련된 투자자에게 오히려 매력적인 매수 기회를 제공합니다.

    현금 흐름의 균형을 맞추는 전략적 도구

    틈새 신용 투자는 더 이상 단순히 위기 상황에 대비하는 방어적 전략이 아닙니다. 이는 성장 지향적인 포트폴리오의 지속 가능한 현금 흐름을 보장하는 전략적 보완 도구입니다. 높은 금리와 변동성이 장기화되는 시대에는 비유동성 투자에 대한 현금 고갈 딜레마를 해결해줄 포트폴리오의 구조적 안정성이 필수적입니다. 틈새 신용 투자를 통해 투자자들은 새로운 기회에 신속하게 자금을 투입할 수 있는 유연성을 확보하게 될 것입니다.

     

    출처: Goldman Sachs 유튜브

    Davidson Kempner Capital Management의 Tony Yoseloff가 거시 경제적 도전과 신용 투자 기회에 대해 논의하는 영상을 통해 더 깊은 통찰을 얻을 수 있습니다.

    Macro Challenges and Credit Opportunities: Davidson Kempner’s Tony Yoseloff

  • AI 시대에도 왜 리더 자리는 여전히 ‘인간’의 몫일까?

    우리는 모두 일터에서 ‘똑똑한 사람’이 성공하고 리더가 된다는 믿음을 가지고 살아갑니다. 그런데 만약 당신의 팀장이나 대표가 아무리 명민해도, 미래의 AI만큼은 똑똑해질 수 없다면 어떨까요?

    초지능 AI의 시대가 도래하면서, 우리는 오랫동안 믿어왔던 ‘지능 만능주의’를 근본적으로 재검토할 수밖에 없게 되었습니다. 단순히 IQ가 높거나 뛰어난 분석 능력을 가진 사람만이 세상을 이끌 것이라는 믿음은 현실과 얼마나 동떨어져 있을까요? 세계적인 벤처 투자자 마크 앤드리슨(Marc Andreessen)과 벤 호로비츠(Ben Horowitz)의 심층적인 논의를 통해, AI 시대의 리더십, 창의성, 그리고 성공의 진짜 본질을 파헤쳐 봅니다.

    AI는 ‘진정한 창의력’을 갖추었는가?

    AI의 능력에 대한 가장 흔한 비판 중 하나는 ‘진정한 개념적 돌파는 불가능하다는 것입니다. 즉, AI는 그저 학습 데이터를 짜깁기하는 ‘리믹스’에 불과하다는 주장입니다.

    앤드리슨은 이 관점에 반문합니다. 과연 얼마나 많은 인간이 베토벤이나 아인슈타인처럼 진정한 돌파를 이룰까요? 그는 대부분의 인간은 절대 그렇게 하지 못한다고 말합니다.

    사실 기술과 예술의 역사를 살펴보면, 대부분의 혁신은 ‘아이디어의 재결합(Remixing)’의 결과입니다. AI는 이미 인류의 99.99%가 넘는 수준의 지능과 창의성을 보여주고 있습니다. 따라서 AI가 ‘최고의 천재’ 수준에 도달하지 못하더라도, 인류의 발전에 막대한 기여를 할 것이라는 점은 분명합니다.

     

    1000 IQ의 AI가 세상을 지배할 수 없는 이유

    사회과학적으로 볼 때, 지능(IQ)은 교육, 직업, 소득 등 긍정적인 삶의 결과와 상관관계가 높습니다. 그러나 이 상관계수는 0.4에 불과하며, 지능이 전부는 아니라는 것을 의미합니다. 실제 세상을 움직이는 것은 단순히 가장 똑똑한 사람이 아닙니다.

    오히려 지능이 너무 높으면 문제가 발생할 수 있습니다. 미군은 리더가 팔로워보다 IQ 표준편차 1 이상 차이 날 경우 리더십에 심각한 어려움을 겪는다는 것을 발견했습니다.

    이는 리더가 팀원들의 머릿속 생각을 제대로 모델링하는 능력, 즉 이론적 마음(Theory of Mind)을 상실하기 때문입니다. 공감과 이해가 불가능한 초지능은 결국 사람들을 효과적으로 관리하고 이끌 수 없습니다.

     

    리더십과 성공을 결정하는 ‘비(非)지능적’ 요소들

    지능 외에 기업가 정신과 리더십을 결정하는 요소는 무엇일까요? 벤 호로비츠는 정서적 이해상황 판단력을 가장 중요하게 꼽습니다.

    리더는 단순히 인기 있는 결정이 아니라 ‘올바른’ 결정을 내리도록 팀을 이끌어야 합니다. 때로는 팀원들이 원하지 않는 방식으로 대립해야 할 용기가 필요합니다. 상대방이 어떻게 생각하고 있는지 깊이 이해하고, 그들의 관점을 통해 상황을 바라보는 능력이 중요합니다.

    이러한 리더십 능력은 회사, 제품, 사람, 조직도에 따라 매우 달라집니다. 따라서 상황적 맥락에 대한 깊은 이해가 필요하며, 이는 단순한 지능이나 알고리즘으로 대체될 수 없는 인간 고유의 영역입니다. 성공은 복잡하고 미묘한 다양한 요소들의 조합이며, 원시적인 지능이 전부는 아닙니다.

     

    챗봇을 넘어설 ‘차세대 AI 제품’의 형태

    현재의 AI 논의는 구글의 ‘검색 엔진’과 OpenAI의 ‘챗봇’ 간의 경쟁 구도로 단순화되는 경향이 있습니다. 하지만 이는 미래의 제품 형태를 미리 규정하는 위험한 실수일 수 있습니다.

    앤드리슨은 PC 산업의 역사를 예로 듭니다. 1975년부터 1992년까지 17년간 PC는 텍스트 프롬프트 시스템이었습니다. 하지만 이후 GUI와 웹 브라우저가 등장하며 제품의 형태는 급진적으로 바뀌었습니다.

    마찬가지로 AI 혁명도 결국 챗봇을 넘어서는 완전히 새로운 사용자 경험(UX)을 발명할 것입니다. 제품 기획자와 개발자는 아직 우리 눈에 보이지 않는 차세대 사용자 경험의 형태를 찾아내고 구축할 엄청난 기회를 가지고 있습니다.

     

    AI 인재 및 인프라의 ‘부족’은 곧 ‘과잉’으로 변한다

    현재 AI 산업은 숙련된 연구원과 인프라(칩, 전력)의 부족이라는 병목 현상을 겪고 있습니다. 하지만 시장의 논리는 이를 해소할 것입니다. 부족은 대규모 공급을 창출하는 가장 강력한 경제적 동기입니다.

    실제로 중국은 비(非)네임드 인재를 빠르게 훈련시키며 기술 격차를 좁히고 있습니다. 엔비디아와 같은 칩 업계의 독점적인 위치 또한 영원하지 않을 것입니다. 과거 모든 칩 부족은 결국 과잉 공급으로 이어졌기 때문입니다.

    5년 뒤 AI 산업이 직면할 도전은 현재의 도전과 완전히 다를 것입니다. 이처럼 역동적인 산업에서는 고정된 시각을 버리고 항상 ‘첫 번째 원칙(First Principles)’에서부터 다시 생각해야 합니다.

     

    AI는 우리가 생각하는 것 이상으로 창의적이고 똑똑합니다. 그러나 성공적인 리더십과 경영은 단순한 지능을 넘어, 인간의 정서와 복잡한 상황을 이해하는 능력에 달려 있습니다. 결국 AI 시대에 가장 가치 있는 인재는 AI보다 똑똑한 사람이 아니라, 초지능 AI와 지극히 인간적인 사람들을 연결하는 연결자가 될 것입니다.

     

    출처: a16z 유튜브

  • 7경 달러 AI 군비 경쟁에서 살아남는 법: 한국 경제의 생존 전략을 재설계하다

    우리는 지금 ‘잃어버린 성장 동력’이라는 불안감 속에서 살고 있습니다. 매달 월급을 받지만, 이 돈이 어쩐지 점점 더 가치가 없어지는 듯한 기분을 떨칠 수 없습니다. 우리 사회의 저성장과 고비용 구조, 여기에 미·중 갈등이 던지는 불확실성까지 더해지며 경제 성장의 시계는 멈춘 것처럼 보입니다.

    과연 우리 경제는 이대로 멈춰 서야 할까요? SK 최태원 회장은 이 위기를 타개하기 위해서는 기존의 수출 주도 성장 모델을 완전히 버려야 한다고 이야기합니다. 이제는 정부와 기업, 사회 전체의 ‘성장 패러다임’ 자체를 근본적으로 재설계할 때입니다. 이 새로운 설계의 핵심은 무엇이며, 왜 지금 당장 변해야 하는지 살펴봅니다.

     

    거품 논쟁은 사치입니다: AI는 생존을 위한 ‘군비 경쟁’입니다

    많은 경제 전문가들이 AI 기술 분야의 과열을 두고 ‘버블’이라는 경고음을 울리고 있습니다. 하지만 최 회장은 지금 AI 투자를 멈추는 것은 버블에 대한 우려보다 훨씬 더 큰 위협을 자초하는 것이라고 진단합니다. AI는 단순한 기술 경쟁이 아니라, 미국과 중국이 패권을 다투는 ‘전쟁’이자 ‘군비 경쟁’의 영역에 들어섰기 때문입니다.

    경쟁국 모두가 AI 인프라스트럭처에 대한 투자를 멈추지 않을 것입니다. 실제로 샘 올트먼 OpenAI CEO는 전 세계적으로 7조 달러 규모의 AI 데이터 센터를 건설해야 한다고 말했습니다. 과거 냉전 시대에 러시아와 미국이 군비 경쟁을 멈추지 않았던 것처럼, 이제는 AI 인프라 구축 자체가 국가 안보와 미래 생존을 좌우하는 핵심 전략이 된 것입니다.

    따라서 투자를 주저하고 관망하는 자세는 우리 경제에 더 큰 피해를 안겨줄 수 있습니다. 현재의 불확실한 국제 정세에만 초점을 맞추는 것은 단 하나의 현상에 매몰되는 것입니다. 지금처럼 미래가 불안할수록 우리는 AI와 같이 ‘해야 할 일’에 더욱 집중하고 과감하게 투자해야 합니다.

     

    낮은 마진의 ‘하드 머니’를 넘어, 50% 수익률의 ‘소프트 머니’로

    우리가 수십 년간 의존해 온 제조업 기반의 ‘하드 머니(Hard Money)’ 수출 모델은 이미 한계에 다다랐습니다. 제조업의 평균 이익률은 전 세계적으로 3% 내외에 불과하며, 아무리 잘해야 10%를 넘기 어렵습니다. 게다가 보호무역주의가 심화하면서 관세 보복 등으로 인해 과거와 같은 규모의 성장을 기대하기 어려워졌습니다.

    이제는 ‘소프트 머니(Soft Money)’ 모델로 전환해야 합니다. 소프트 머니는 지식이나 문화 콘텐츠처럼 마진율이 50% 이상까지도 나올 수 있는 고부가가치 상품을 의미합니다. 물론 K-컬처와 같은 소프트 상품을 만들고 파는 능력은 우리에게 있습니다.

    하지만 중요한 것은 그 이익을 가져가는 구조를 누가 짜느냐의 문제입니다. 한국에서 만든 드라마로 가장 큰 이익을 보는 것은 콘텐츠 제작자가 아니라 넷플릭스라는 플랫폼입니다. 결국 우리는 단순히 좋은 콘텐츠를 만드는 것을 넘어, 투자와 인프라스트럭처를 통해 마진을 극대화할 수 있는 구조를 구축해야 합니다.

     

    K-푸드 세계화의 실패 이유: ‘산업화’만이 살 길입니다

    소프트 머니의 대표적인 예시로 ‘한식의 산업화’가 언급됩니다. 이는 단순히 한식의 세계화를 넘어, 맥도날드처럼 전 세계인이 ‘예측 가능성’을 갖고 소비할 수 있는 시스템을 만드는 것을 목표로 합니다. 맥도날드를 방문하는 사람은 언제나 일정한 퀄리티와 서비스, 메뉴 이름을 기대합니다.

    그러나 한식은 아직 이러한 ‘산업화’ 단계에 진입하지 못했습니다. 메뉴 이름조차 통일되어 있지 않아 같은 ‘된장찌개’라도 식당마다 맛과 재료가 천차만별입니다. 이는 외국인 소비자에게 혼란을 주고 한식의 글로벌 확산에 걸림돌이 됩니다.

    따라서 메뉴의 표준화, 식자재 유통, 주방 시스템, 식당 인테리어에 이르는 모든 서플라이 체인을 정비해야 합니다. 이는 단순히 개별 기업의 노력만으로는 불가능합니다. 국가가 전략을 수립하고 펀드를 조성하여 민간의 활력을 보태는 장기적인 국가 대항전 형태의 ‘산업화’ 전략이 필요합니다.

    중소기업 ‘보호’를 넘어, ‘성장’에 보상하는 정책으로

    우리 사회의 또 다른 저성장 원인은 성장을 막는 ‘계단식 규제’입니다. 현행 정책은 중소기업을 보호의 대상으로 간주하여, 이들이 일정 규모 이상으로 성장하면 지원 대상에서 제외하고 각종 규제를 적용합니다. 이는 기업가들이 성장을 하려는 동기를 잃게 만듭니다.

    정부 정책의 우선순위는 ‘보호’가 아닌 ‘성장’이 되어야 합니다. 과거 수출 드라이브 정책처럼, 성과(수출액)를 달성한 기업에 금융 및 행정 지원을 집중하여 다음 단계의 성장(2배 수출액)을 유도해야 합니다. 결과를 가져오는 기업을 지원해야만 제한된 국가 자원의 효율성을 극대화하고 전반적인 성장을 이끌 수 있습니다.

    또한, 신산업을 육성하기 위해서는 규제 ‘샌드박스’의 개념을 혁신해야 합니다. 현재의 샌드박스는 규모가 너무 작아 대규모 기술 테스트를 진행하기 어렵습니다. 인공지능, 자율주행, 드론 서비스 등 미래 기술을 실험할 수 있는 **’메가 샌드박스’**를 구축해야 합니다. 인구 200만~300만 명 규모의 대도시를 통째로 실험장(테스트 베드)으로 지정하여, 데이터 규제 등을 완화하고 해외 기업의 R&D 센터 유치를 유도해야 합니다.

     

    내수를 살리는 유일한 길: 500만 명의 고급 두뇌를 유입해야 합니다

    한국 경제가 직면한 가장 심각한 문제는 저출산과 고령화로 인한 내수 시장의 축소입니다. 수출이 어렵다면 내수를 늘려야 하지만, 인구가 감소하고 있어 이마저도 불가능한 상황입니다. 이 문제를 해결할 수 있는 유일한 방법은 해외로부터 고급 인력을 유입하는 것입니다.

    궁극적인 목표는 소비를 늘리고 경제 활동을 활성화할 수 있도록 500만 명 수준의 고급 두뇌를 유치하는 것입니다. 단순 노동자가 아닌 소득이 많은 고급 인력이 유입되어야 내수 소비가 늘어나는 선순환이 가능합니다. 이를 위해 특정 지역에 ‘메가시티’를 조성하고, 공용어 사용, 주택 구매의 자유, 한시적인 영주권(그린 카드) 등 파격적인 유인책을 제시해야 합니다.

    고급 인력이 한국에 와서 자유롭게 일하고 정착할 수 있는 환경을 만들어 준다면, 그들은 내수 시장의 강력한 동력이 되어 줄 것입니다. 500만 명이 들어와 살고 서비스를 이용하게 되면, 이를 뒷받침하기 위한 새로운 일자리(500만 개의 일자리) 역시 함께 창출됩니다. 이는 한국 경제의 성장 동력을 근본적으로 교체하는 거대한 국가 프로젝트입니다.

    지금은 낡은 방식으로는 더 이상 살아남을 수 없는 시대를 맞이했습니다. AI라는 피할 수 없는 전쟁부터, 시대착오적인 성장 규제, 줄어드는 내수 문제까지 해결해야 할 과제는 산적해 있습니다. 우리 사회는 성장을 최우선 가치로 두고, 소프트머니 산업화와 해외 고급 두뇌 유입이라는 새로운 설계도를 과감하게 펼쳐야 합니다. 그렇지 않으면 한국 경제는 회복 불가능한 궤도에 진입할 수 있습니다.

     

    출처: 언더스탠딩 : 세상의 모든 지식 유튜브