[황승진의 AI칼럼] 글로벌 물류, 멀티에이전트 LLM과 Manus

이런 가정을 해보자. 중국의 한 도시에 글로벌 로지스틱스 컴퍼니(Global Logistics Company, 이하 GL)라는 가상의 회사가 있다. 이 회사는 상당한 고객 기반을 갖고 있다. 이 도시에 100개 이상의 고객 기업이 있고, 대부분은 가구 또는 건축 자재 제조업체다. 이들은 전 세계에 흩어져 있는 고객에게 제품을 배송한다. 각 제조업체는 제품을 '크레이트'라는 나무상자에 담아 포장하고 보호한다. 매달 GL는 수백 개 크레이트의 배송 주문을 받는다. 지금까지는 요청이 도착할 때마다 즉흥적으로 실행했다. 하지만 최적화 개념은 없고, 주먹구구식으로 운영, 이에 비용 절감의 많은 기회를 놓치고 있다. 나아가, 이러한 주먹구구식 관행은 수많은 비준수(non-compliance) 사례로 이어졌다. 비준수는 고객과의 계약 조건 또는 규정 위반을 의미하며, 이는 페널티와 신뢰도 손실로 이어진다.

GL은 AI를 활용해 지금보다 더 잘할 수 있다. 예로, 크레이트를 개별적으로 배송하는 대신, 서로 가까운 목적지(예, 북가주)로 향하는 수십 개의 크레이트를 모아 풀 컨테이너로 지역별 물류기지로 일단 옮긴 후 작은 트럭으로 최종 목적지까지 배송하면 비용 면에서 더 효율적이다. 단, 고객이 오래 기다려야 하기 때문에 약속한 배송 시간 미준수로 이어질 수 있다. 이에, 가능한 한 빨리 크레이트를 배달하고 규정 및 계약의 모든 준수 사항을 충족하면서 비용을 최소화하는 것이 이 회사가 가진 화두이자 도전이다. 이를 비용, 시간, 준수로 구성된 삼각형 모델로 요약할 수 있다. 이 모델을 수학적으로 푸는 건 불가능하지만 AI는 가능하다.

GL은 AI 에이전트 모델로 이 삼각형 모델을 접근할 수 있다. 한 명의 마스터 에이전트와 비용, 시간, 준수를 각각 담당하는 세 명의 에이전트를 만든다. 비용 에이전트는 2개월 이내에 배송하되 비용을 최소화하는 10개 계획을 찾아 마스터 에이전트에게 추천한다. 시간 에이전트는 주어진 예산 내에서 배송 시간을 최소화하는 10개 계획을 찾아 마스터 에이전트에게 추천한다. 마스터 에이전트는 이러한 20개 계획을 받아, 준수 에이전트에게 준수 여부를 확인하도록 시킨다. 계약과 규정을 준수하는 계획만 통과된다. 끝으로 인간 사용자가 최선의 계획을 선택한다.

왜 이것이 새로운 것일까? '준수 검사의 자동화'다. 최적화 문제는 목적함수, 결정변수, 그리고 제약조건으로 이뤄져 있다. 다음과 같이 생겼다: maxx f(x), subject to Ax<=b. 여기서 끝에 나온 제약조건 혹은 준수조항은 이렇게 깔끔하게 수학 방정식으로 표현하기 힘들다. 더욱이 준수 조항은 규정, 계약, 고객 요청, 내부 정책 및 절차, 보험 정책 및 노동 계약의 형태로 많은 문서에 흩어져 있다.

LLM 이전에는 이 문서 더미에서 어떤 문장이 내 결정과 관련이 있는지를 몰랐다. 이에 계획의 준수 여부를 눈과 손으로 직접 체크해야 했다.하지만 이제 준수 에이전트는 전체 라이브러리를 뒤져 관련한 내용만 추출할 수 있다. 또 이제 LLM 덕분에 '텍스트' 검색이 가능해져 AI는 더 넓은 응용 분야에서 강력한 도구가 됐다.

우리는 이제 ‘방정식과 텍스트’를 최적화할 수 있다. 이는 최적화 분야에서 새로운 패러다임을 뜻한다. 텍스트를 포함하는 수많은 문제가 이 기회를 기다리고 있다. 예로 법학, 지배구조, 금융 분야가 큰 수혜자가 된다. 특히 준수는 규제기술(Regulation Technology, RegTech)이란 새로운 AI 응용분야를 만들었다. 심지어 compliance.ai라는 기업까지 생겼다.

이 물류 사례를 통해, 멀티에이전트 LLM 모델을 생각해 본다. 여기서는 마스터 에이전트와 다른 에이전트 간에 많은 워크플로가 일어난다. 일의 분담, 개별 작업, 결과 보고, 에이전트간 조율, 그리고 종합과 정리가 필요하다.

에이전트는 다음과 같은 종류가 있다. 첫째, LLM 기반 에이전트다. 이런 에이전트는 LLM의 기능을 활용해 정보를 처리하고, 텍스트를 생성하고, 결정을 내린다. 둘째, 도구 기반 에이전트다. 이런 에이전트는 제한된 기능을 가지고 웹 검색, DB 액세스, 계산 실행과 같은 특정 작업을 수행하기 위해 외부 도구 또는 API와 상호 작용한다. 셋째, 인간 에이전트다. 경우에 따라 인간 에이전트를 그래프에 통합해 인간과 상호 작용할 수 있다.

워크플로 작업을 지원하기 위해서는 에이전트간 정보를 공유하는 통신 메커니즘이 필요하다. 이를 위해 랭그래프(LangGraph)는 '상태(state)' 변수를 유지하는 한편 기록을 기억하는 메모리를 갖고 있다. 상업용 멀티에이전트 프레임워크는 CrewAI, LangGraph,구글 버텍스, n8n, Magentic-One, Agentforce 등이 있다.

내가 아는 실리콘밸리의 한 개발자는 멀티에이전트 모델을 기피한다. 웬만한 건 하나의 에이전트로도 가능하고, 멀티는 만들기 복잡하다고 한다. 여기에 큰 시스템의 경우 성능도 별로라고 한다. 이는 제 2의 딥시크라 불리는 중국 스타트업 '매너스(Manus)'에게 기회를 줬다.