구글, 제미나이 통합 API '인터랙션스' 정식 출시…모델·에이전트를 하나로

컴퓨팅입력 :2026/06/26 21:33

구글이 제미나이(Gemini) 모델과 AI 에이전트를 하나의 창구로 다루는 통합 인터페이스 '인터랙션스 API(Interactions API)'를 정식 출시(GA)했다고 6월 22일 밝혔다. 2025년 12월 베타로 공개한 뒤 개발자들이 가장 선호하는 방식으로 자리 잡았고, 이번 정식 출시로 제미나이를 다루는 구글의 기본 API가 됐다.

인터랙션스 API는 모델 호출과 에이전트 실행을 한 엔드포인트로 묶는다. 모델 ID를 넘기면 추론을, 에이전트 ID를 넘기면 자율 작업을 실행하고, 'background=True'를 설정하면 오래 걸리는 작업을 서버가 비동기로 처리한다. 서버 측 상태 저장, 백그라운드 실행, 여러 도구 조합, 멀티모달 생성을 모두 한 번의 호출로 다룰 수 있다.

이번 정식 출시에는 개발자 요청이 많았던 기능이 대거 들어갔다. '매니지드 에이전트'는 API 호출 한 번으로 원격 리눅스 샌드박스를 띄워, 에이전트가 추론하고 코드를 실행하며 웹을 탐색하고 파일을 다루게 한다. 기본 에이전트로 '안티그래비티(Antigravity)'가 제공되고, 직접 지침·스킬·데이터 소스를 정의한 커스텀 에이전트도 만들 수 있다. 도구 조합 기능은 구글 검색·지도 같은 내장 도구와 자체 함수를 한 요청에 섞어 쓰게 하고, 도구 결과를 텍스트와 이미지로 함께 돌려준다.

딥리서치 기능은 속도형과 심층형 두 버전으로 나뉘고, 협업 계획과 차트·인포그래픽 생성, 이미지·PDF·오디오 기반 분석을 지원한다. 미디어 생성에서는 나노바나나 2(Nano Banana 2) 이미지 생성, 리리아 3(Lyria 3) 음악 생성, 다중 화자 음성 합성을 제공한다. 스키마도 기존 '역할(Roles)' 구조에서 모든 동작을 개별 단계(Steps)로 다루는 방식으로 단순화했다.

비용 면에서는 플렉스(Flex)와 프라이어리티(Priority) 티어로 비용이나 지연 시간을 골라 최적화할 수 있고, 플렉스는 비용을 50% 낮춘다. 인터랙션스 API는 구글 AI 스튜디오와 제미나이 API, 공식 문서의 기본값이 됐다. 기존 generateContent API도 계속 지원되지만, 장시간 작동하는 모델과 에이전트의 최신 기능은 점차 인터랙션스 API에만 들어갈 전망이다. 상태를 유지하는 에이전트 중심 개발이 표준으로 옮겨가고 있다.

자세한 내용은 구글에서 확인할 수 있다.

이미지 출처: 구글

관련기사

■ 이 기사는 AI 전문 매체 ‘AI 매터스’와 제휴를 통해 제공됩니다. 기사는 클로드 3.5 소네트와 챗GPT를 활용해 작성되었습니다. (☞ 기사 원문 바로가기)