Categories: Uncategorized

AI 비서에게 10억 예산 결재를 맡긴다면? — 위험한 AI 행동을 막는 ‘휴먼 인 더 루프’ 미들웨어

방금 AI 비서가 중요한 파트너에게 메일을 보냈다는 알림을 받았습니다. 하지만 메일 내용이 내가 의도했던 것과 완전히 다르다면 어떨까요?

특히 AI 에이전트가 ‘실행력’을 갖게 될 때, 사용자의 불안감은 커질 수밖에 없습니다. 메일 발송이나 대규모 예산 승인처럼 한 번 실행되면 되돌릴 수 없는 행동을 AI가 하기 직전, 인간이 멈춰 세우고 확인해야 합니다.

이러한 AI의 위험하거나 비싼 행동을 사전에 방지하는 것이 바로 ‘휴먼 인 더 루프(Human-in-the-Loop, HIL)’ 미들웨어의 핵심입니다. HIL은 AI의 효율성과 인간의 최종 통제력을 결합하는 필수적인 안전장치입니다.

 

AI 에이전트의 기본적인 ‘실행 루프’

AI 에이전트는 기본적으로 모델이 외부 도구를 호출하는 반복적인 작업을 수행합니다. 모델은 최종적인 응답을 사용자에게 전달하기 전까지 필요한 도구를 연쇄적으로 계속 실행합니다.
예를 들어, 메일을 보내야 한다면 ‘메일 발송 도구(Send Email Tool)’를 호출하는 식입니다. HIL 미들웨어는 이 실행 루프의 중간에 인간의 개입 단계를 추가하여 안전성을 높입니다.

 

비싸거나 위험한 도구 실행을 막는 방패

HIL 미들웨어는 도구 실행이 실제 돈이 들거나(Expensive) 큰 비즈니스 리스크를 수반할 때 특히 유용합니다. 실제 결제가 일어나는 금융 API를 호출하거나, 대량의 고객 데이터를 삭제하는 등의 행위가 여기에 해당합니다. 미들웨어는 모델이 도구 호출을 결정하는 순간 그 실행을 잠시 멈춥니다. 그 후 인간 사용자의 최종적인 피드백을 받고 나서야 실제 도구 실행을 조건부로 재개합니다.

 

HIL 미들웨어가 제공하는 세 가지 의사결정 방식

HIL은 단순한 ‘실행 또는 중지’를 넘어 세밀한 인간의 통제를 지원합니다. 사용자가 AI의 잠재적 행동에 대해 내릴 수 있는 가장 일반적인 세 가지 의사결정 방식이 있습니다.

첫째, 승인(Approval)은 AI가 작성한 내용(예: 메일 초안)을 검토한 후 이상이 없다고 판단할 때 사용합니다. 초안은 작성된 그대로 최종 발송이 진행됩니다.
둘째, 수정(Edit)은 AI의 초안에 수신자 변경이나 문구 수정과 같은 부분적인 편집이 필요할 때 사용합니다. 수정된 내용을 바탕으로 도구 실행이 즉시 재개됩니다.
셋째, 거부(Rejection)는 AI의 초안을 완전히 거부하고 모델에게 왜 다시 작성해야 하는지 피드백 메시지를 제공할 때 선택합니다.

 

100만 달러 예산 승인 사례로 본 안전장치 작동

예를 들어, AI 에이전트에게 100만 달러(약 10억 원) 규모의 분기 예산 승인 메일을 파트너에게 작성하도록 요청하는 상황을 가정해 봅시다. AI는 “검토 후 승인했습니다”는 내용으로 메일 초안을 만들고 이를 발송 도구에 전달합니다.

이때 HIL 미들웨어가 즉시 개입하여 실행을 가로챕니다. 만약 성급한 승인이 부담된다면, 사용자는 ‘수정’ 옵션을 선택하여 “제안을 상세 검토 중입니다. 곧 최종 확정본을 보내드리겠습니다”라는 신중한 문구로 직접 변경하여 발송할 수 있습니다.

혹은 ‘거부’ 옵션으로 “세부 제안 내용에 대한 더 많은 정보가 필요합니다”라는 메시지를 모델에 되돌려 보냅니다. 모델은 이 피드백을 학습하여 메일 초안을 개정하고, 개정된 초안은 다시 HIL 미들웨어를 거쳐 최종 승인을 기다리게 됩니다.

HIL 미들웨어는 AI 에이전트가 복잡하고 민감한 비즈니스 로직을 수행하는 환경에서 인간의 통제력을 유지하는 핵심 기술입니다. 우리는 AI에게 업무를 위임하는 동시에, 최종적인 책임과 판단을 놓치지 않는 균형 잡힌 시스템을 구축해야 합니다.

 

출처: LangChain 유튜브

 

hjsteven

Recent Posts

AI는 어떻게 ‘내 마음’을 읽고 업무까지 처리해줄까요? (AI 에이전트의 비밀)

혹시 챗봇에게 "이번 출장 항공권 좀 알아봐 줘"라고 말했을 뿐인데, 내가 선호하는 항공사와 회사 규정까지…

2일 ago

AI에게 일을 시켰는데, 왜 내 피로도는 줄지 않을까?

"설거지는 내가 할게, 걱정 말고 쉬어." 가족 중 누군가가 이렇게 말해놓고 한참이 지나도록 움직이지 않는다면…

2일 ago

AI가 우리를 속이기 시작했다: ‘착한 척’ 연기하는 인공지능의 소름 돋는 진실

AI가 스스로 '처세술'을 터득했다면 믿으시겠나요? 최근 Anthropic의 실험실에서 충격적인 장면이 포착되었습니다. AI가 삭제되지 않고 살아남기…

3주 ago

“내 AI 프로젝트는 왜 항상 제자리걸음일까?” : 에이전틱 AI(Agentic AI)가 답인 이유

"우리 서비스에도 AI를 도입해야 하지 않을까요?" 아마 최근 회의 시간마다 지겹도록 들은 이야기일 겁니다. 팀의…

3주 ago

50명의 동료를 해고하고 나서야 비로소 깨달은 것들

"내 인생 최악의 날이었습니다." 7년 동안 실패만 거듭했던 한 남자가 있습니다. 27살의 젊은 나이에 창업했지만,…

4주 ago

덩크왕이 어떻게 MIT AI 창업가가 됐을까? 한계를 뛰어넘는 스타트업의 성장 방정식

죽도록 노력했는데도 성과가 보이지 않아 좌절한 적은 없나요? 여기 조금 독특한 이력을 가진 사람이 있습니다.…

4주 ago