"결과만 있고 이유는 없다"...구글 DESIGN.md가 놓친 'AI 디자인' 핵심

김은수 IBM Research UX 엔지니어 "AI 추론 과정, 인간이 제어하고 검증할 수 있어야"

인터넷입력 :2026/04/26 09:31

구글이 AI 디자인 규격 'DESIGN.md'를 공개하며 표준화 경쟁에 불을 지폈다. 하지만 IBM 리서치 김은수 엔지니어는 "결과(What)는 있지만 이유(Why)는 빠져 있다"고 평가했다. AI의 추론 과정을 인간이 제어하고 검증할 수 있는 '사고의 투명성'이 차세대 디자인 도구의 진정한 승부처가 될 것이라는 설명이다.

구글은 지난 21일 AI 디자인 도구 '스티치(Stitch)'의 핵심 파일 규격인 DESIGN.md를 오픈소스로 공개했다. DESIGN.md는 구글 랩스가 개발한 AI 디자인 도구 '스티치'에서 사용하는 마크다운(markdown) 형식의 파일이다. 제품의 색상, 서체, 컴포넌트 등 디자인 시스템 규칙을 AI 에이전트가 읽을 수 있는 형태로 기록한다. 

이에 대해 IBM Research 소속 김은수 UX 엔지니어는 "구글의 이번 발표는 AI를 활용한 디자인 작업에서 각 개인이 각자의 방식으로 풀어오던 숙제를 표준화(standardize)할 수도 있는 중요한 움직임"이라면서도 "그러나 진짜 문제는 아직 풀리지 않았다"는 시각이다.

"결과(what)는 기록되지만 이유(because)는 빠져 있다"

IBM Research 소속 김은수 UX 엔지니어

김 엔지니어는 지디넷코리아와의 서면 인터뷰에서 "현장에서 디자이너들을 관찰해보면, AI가 만든 결과물이 마음에 들지 않을 때 근본적인 문제는 '결과물의 품질'이 아니라 '바꾸고 싶지 않은 부분까지 함께 바뀌어버리는 것'이었다"고 언급했다.

그는 "예를 들어 AI에게 '사용자 타깃을 초보자로 바꿔달라'고 요청했을 때, 화면 구성만 단순하게 바뀌기를 원했는데 버튼 색상, 레이아웃, 톤앤매너까지 연쇄적으로 달라지는 경우가 많다"며 "AI가 내린 결정들 중 어디까지가 서로 연결돼 있는지가 드러나 있지 않기 때문에, 작은 수정 하나가 예상치 못한 곳에서 문제를 일으킨다"고 지적했다.

이어 "기존 AI 도구들도 중간 과정을 들여다볼 수는 있지만, 그것이 디자인 프로세스 안에 통합돼 있지 않아 '어디까지 바꾸고 어디부터는 지켜야 하는지'를 명시할 방법이 없다"면서 "결국 디자이너는 컨트롤을 포기하고 처음부터 다시 시작하거나, 반대로 AI를 아예 쓰지 않는 쪽을 택하게 된다"고 덧붙였다.

DESIGN.md 역시 같은 한계를 공유한다는 것이 김 엔지니어의 분석이다. 그는 "DESIGN.md는 '주요 버튼은 테라코타 색'이라고 기록하지만, 왜 테라코타를 골랐는지, 어떤 조건에서 다시 검토해야 하는지는 담지 않는다"며 "결과는 있지만 이유가 빠져 있는 구조"라고 말했다.

"대화는 기록되지만 참조되지 않는다…디자인 결정의 '상시 산출물' 필요"

DESIGN.md

김 엔지니어는 최근 AI 업계의 움직임 중 앤트로픽의 클로드 디자인 기능을 주목할 만한 진전으로 꼽았다. 디자이너에게 능동적으로 질문을 던지며 중간 결정을 함께 만들어가는 방식이라는 설명이다. 

다만 김 디자이너는 "이 대화의 기록이 디자인 프로세스 안에서 언제든 되돌아가 참조하거나 수정할 수 있는 구조화된 산출물로 자리 잡고 있지는 않다"고 첨언했다. 이어 그는 "이러한 중간 결정들이 '상시 참조 가능한 산출물(standing artifact)'로 디자인 프로세스에 자리 잡아야 언제든 되돌아가 읽고 고칠 수 있게 된다"고 설명했다.

IBM Research에서 진행해온 멀티 에이전트 기반 디자인 시스템 연구는 이 방향의 한 가지 실마리를 보여준다. 김 엔지니어에 따르면, 여러 AI 에이전트가 사용자 조사, 전략 수립, 시각 디자인, 품질 검토 등을 나눠 맡고 서로 작업을 넘기는 '핸드오프(handoff)' 구간마다, 중간 산출물이 자연스럽게 '인간 개입 지점(human-in-the-loop)'을 만들어낸다.

그는 이를 바탕으로 '읽을 수 있고(legible), 제어 가능하며(controllable), 검증 가능한(verifiable) 추론 체인'이라는 개념을 제시했다. 먼저 ▲인간이 AI의 중간 결정을 읽고 이해할 수 있어야 하고(읽기 가능성) ▲그 결정을 바꾸면 전체 결과물이 재계산돼야 하며(제어 가능성) ▲각 결정이 어떤 근거로 내려졌는지 추적하고 확인할 수 있어야 한다(검증 가능성)는 주장이다. 

기존의 human-in-the-loop이 최종 결과물에 대한 검수 단계에 머물렀다면, 이제는 추론 단계 자체를 인간과 AI가 함께 읽고, 제어하고, 검증하는 방향으로 나아가야 한다는 것이다.

김 엔지니어는 이 같은 방향성이 필요한 근본적 이유에 대해 "디자인은 여전히 인간의 의사결정이 필요한 영역이고, 그 판단이 프로세스 곳곳에 영향을 미쳐야 품질 높은 결과물이 나온다"며 "AI를 도입한다고 해서 디자이너의 역할이 줄어드는 것이 아니라, 오히려 어디에서 어떤 판단을 내려야 하는지가 더 명확하게 드러나야 한다"고 강조했다.

클로드 디자인 (사진=앤트로픽)

그는 구체적 형태에 대한 전망도 내놨다. 

김 엔지니어는 "DESIGN.md가 디자인 시스템을 위한 README 파일이라면, 다음에 필요한 것은 '디자인 결정'을 위한 README"라며 "personas.md, journey-map.md 같은 파일들이 인간과 AI의 협업이 수면 위로 드러나는 방식이 될 수도 있다"고 말했다. 

이어 "AI 디자인 도구 경쟁의 다음 무대는 더 좋은 픽셀을 만드는 모델이 아니라, 자신의 사고 과정을 읽을 가치가 있게 만드는 도구가 될 것"이라고 내다봤다.


■김은수(Sue Kim) 엔지니어

-現 IBM Research UX 엔지니어

-AI 기반 디자인 도구 및 멀티 에이전트 UX 시스템 연구

관련기사

-MIT Senseable City Lab 연구 경력

-하버드 디자인 대학원(Harvard GSD) 석사