회사 코드 중 AI가 쓴 것 추적하는 기술 나왔다

컴퓨팅입력 :2026/04/20 23:13

AI가 개발자를 대체할 것이라는 공포는 오랫동안 '막연한 불안'으로 치부됐다. 그런데 2026년 4월, 미국 네바다대학교 라스베이거스(University of Nevada Las Vegas) 연구팀이 그 공포에 처음으로 정확한 숫자를 붙였다. 연구팀은 챗GPT(ChatGPT)가 제안한 코드가 실제 소프트웨어에 얼마나 녹아 들어갔는지를 자동으로 추적하는 도구 '패치트랙(PatchTrack)'을 개발하고, 실제 오픈소스 프로젝트 255개의 338건 풀 리퀘스트(Pull Request, 개발자들이 코드 수정안을 제출하고 검토받는 협업 절차)를 수집해 이 중 병합된 285건을 대상으로 패치 분류 분석을 수행했다.

그림1. 챗GPT와 개발자의 대화

AI 코드의 발자국을 추적하는 기술, 패치트랙

패치트랙(PatchTrack)은 챗GPT가 제안한 코드 조각과 실제로 소프트웨어에 최종 반영된 코드를 토큰 단위로 비교·분류하는 분석 도구다. 다니엘 오겐르왓(Daniel Ogenrwot)과 존 부싱에(John Businge) 연구팀이 2026년 4월 arXiv에 공개한 논문 'PatchTrack: A Comprehensive Analysis of ChatGPT's Influence on Pull Request Outcomes'에서 처음 소개됐다. 패치트랙이 특별한 이유는 단순히 "AI를 썼느냐"를 묻는 것이 아니라, AI가 생성한 코드 중 실제로 몇 줄이 제품에 들어갔는지를 수치로 측정한다는 점이다.

연구팀은 분석 대상을 '자기 공개 챗GPT 사용(SACU, Self-Admitted ChatGPT Usage)', 즉 개발자가 스스로 풀 리퀘스트 코멘트나 커밋 메시지에 "챗GPT를 활용했다"고 밝힌 사례로만 한정했다. AI 사용을 숨긴 사례는 애초에 집계에 포함되지 않았다. 다시 말해 이 논문의 수치는 수면 위로 드러난 AI 의존도만 보여주는 최솟값이다.

그림2. 연구 방법론 개요

실제 코드 10개 중 4개에 이미 AI 흔적이 있었다

패치트랙으로 풀 리퀘스트 중 병합된 285건 분석한 결과, 116건(40.7%)에서 챗GPT가 제안한 코드가 실제 소프트웨어에 반영된 것으로 확인됐다. 10개 프로젝트 중 4개에 AI가 제안한 코드가 들어간 셈이다. 나머지는 코드를 직접 채택하지 않은 경우(22.1%)이거나, 챗GPT가 코드 대신 개념 설명이나 방법론 조언을 제공한 경우(37.2%)였다.

여기서 더 주목해야 할 것은 채택 비율이 아니라 채택 방식이다. 코드가 반영된 116건을 세밀하게 들여다보면, 챗GPT 코드를 그대로 붙여넣기 한 사례는 극소수였다. 대부분의 개발자는 AI의 제안을 출발점 삼아 상당 부분을 수정한 뒤 최종 코드에 반영했다. 챗GPT가 제안한 코드 중 실제로 반영된 부분의 중앙값은 전체 제안 코드의 25%에 불과했다. 평균적으로 AI가 내놓은 코드의 4분의 3은 인간 개발자에 의해 걸러지거나 다시 쓰인다는 뜻이다.

연구팀은 AI 코드가 반영된 89건을 심층 분석해 네 가지 반복 패턴을 발견했다. 반복적 정제(Iterative Refinement)—AI 코드를 뼈대로 삼되 팀의 코딩 규칙에 맞게 계속 고쳐나가는 방식—가 26건으로 가장 많았고, 선택적 추출(Selective Extraction)—AI 코드에서 필요한 부분만 잘라 쓰는 방식—이 18건, 구조적 통합(Structural Integration)—AI 코드 전체 구조를 프로젝트에 맞게 재편하는 방식—이 19건이었다. AI가 만들어낸 코드가 그대로 제품에 들어가는 경우는 3건에 그쳤다.

AI가 코드 한 줄 안 써도 개발자의 판단을 이미 바꾸고 있다

이 연구가 단순한 코드 채택률 측정에서 멈추지 않은 이유가 여기 있다. 챗GPT가 코드 조각을 생성하지 않고 텍스트 설명이나 이론적 조언만 제공한 84건을 분석한 결과, 개발자들은 AI의 조언을 바탕으로 코드 설계 방식을 바꾸거나 문서를 수정하거나 버그를 다른 방식으로 접근했다. AI는 코드를 한 줄도 직접 쓰지 않았지만 개발자의 사고 자체를 변경한 것이다.

연구팀은 이를 네 가지로 분류했다. 가장 많은 44건에서 개발자들은 AI에게 프로그래밍 개념이나 설계 원칙을 물어 그 답변을 근거로 코드 구조를 개선했다. 23건에서는 AI가 제안한 문구나 용어를 코멘트와 문서에 반영했다. 한 사례에서는 개발자가 깃(Git)에서 파일 이름을 변경하는 방법을 챗GPT에 물었고, AI의 조언대로 커밋 방식을 바꿔 파일 이름 변경이 삭제-추가가 아닌 '이름 변경'으로 정확히 기록되게 했다. 코드 한 줄도 AI가 직접 작성하지 않았지만, 최종 결과물은 AI가 없었다면 달랐을 것이다.

AI 코드가 거부된 진짜 이유가 더 불편한 진실이다

챗GPT의 제안이 채택되지 않은 56건을 분석한 결과에서 더 불편한 진실이 드러난다. 개발자들이 AI 코드를 거부한 가장 큰 이유는 코드의 질이 나빠서가 아니었다. 프로젝트의 코딩 관습이나 아키텍처(Architecture)—소프트웨어의 전체 구조 설계—와 맞지 않아서가 가장 흔한 이유였다.

실제로 한 사례에서는 챗GPT가 정규표현식(Regular expression)—특정 패턴의 텍스트를 찾는 코드 표현법—을 제안했지만, 리뷰어(Reviewer)가 "우리 프레임워크의 공식 방식대로 하자"고 지적하면서 AI 코드가 폐기됐다. 기술적으로는 올바른 코드였지만 팀의 오랜 관습과 맞지 않았기 때문이다. 또 다른 사례에서는 챗GPT가 성능 개선을 제안했지만, 리뷰어들이 "단기 수선이 아닌 장기적 근본 해결이 필요하다"며 거부했다. AI가 맞는 말을 했어도 팀의 철학과 방향이 달랐던 것이다.

이것이 의미하는 바는 두 가지다. 지금 AI가 개발자를 완전히 대체하지 못하는 거의 유일한 이유는 '프로젝트 맥락 이해 능력의 부재'다. 그리고 AI가 그 능력을 갖추는 순간, 현재 거부되는 코드의 상당수가 더 이상 거부되지 않을 수 있다.

AI가 개발자의 역할을 대체하기 시작했다는 첫 번째 증거

패치트랙이 보여준 것은 단순한 통계가 아니다. AI가 실제 개발 현장에서 어떻게, 얼마나, 어떤 방식으로 개발자의 역할을 대신하거나 보조하는지를 처음으로 실증적으로 추적한 사례다. 연구진은 AI의 영향력을 코드 생성 그 이상으로 확장해서 바라봐야 한다고 강조한다. AI는 이미 개발자가 코드를 짜는 방식뿐만 아니라, 문제를 접근하는 방식, 팀 내에서 의사결정을 하는 방식까지 바꾸고 있다.

이 연구에서 분석된 사례는 모두 개발자가 AI 사용을 스스로 공개한 경우만 포함됐다는 점을 기억해야 한다. 실제 현장에서 AI 도움을 받았지만 밝히지 않은 코드가 얼마나 더 많을지는 누구도 정확히 알 수 없다. 패치트랙이 드러낸 40.7%는 수면 위의 빙산일 가능성이 있다. 연구팀은 패치트랙의 분류 정확도가 97.5%에 달한다고 밝혔고, 이 도구를 오픈소스로 공개해 향후 더 광범위한 AI 침투 분석이 가능하도록 했다.

FAQ( ※ 이 FAQ는 본지가 리포트를 참고해 자체 작성한 내용입니다.)

Q. 패치트랙(PatchTrack)이란 무엇인가요?

패치트랙은 챗GPT가 제안한 코드와 실제 소프트웨어에 최종 반영된 코드를 자동으로 비교·분류하는 분석 도구입니다. 미국 네바다대학교 라스베이거스 연구팀이 개발했으며, AI가 실제 개발 현장에 미치는 영향력을 처음으로 수치화하는 데 활용됐습니다.

Q. 개발자가 AI 코드를 거부하면 AI의 영향이 사라지나요?

그렇지 않습니다. 이번 연구에 따르면, AI가 제안한 코드를 채택하지 않은 경우에도 개발자들은 AI의 개념 설명, 디버깅 전략, 문서화 방식 등을 참고해 최종 결과물에 영향을 받는 것으로 나타났습니다. 코드 채택 여부와 무관하게 AI는 이미 개발자의 판단 과정에 깊이 개입하고 있습니다.

Q. 이 연구가 개발자의 미래 직업에 주는 시사점은 무엇인가요?

현재 AI는 프로젝트의 문화적 맥락이나 팀 관습을 이해하지 못해 코드가 거부되는 경우가 많습니다. 그러나 AI가 맥락 이해 능력을 갖추게 되면 개발자 역할에 더 큰 변화가 올 수 있습니다. AI와의 협업 능력, 코드 검토 역량, 프로젝트 설계 능력이 향후 개발자에게 핵심 경쟁력이 될 것입니다.

기사에 인용된 리포트 원문은 arXiv에서 확인할 수 있다.

관련기사

리포트명: PatchTrack: A Comprehensive Analysis of ChatGPT's Influence on Pull Request Outcomes

■ 이 기사는 AI 전문 매체 ‘AI 매터스’와 제휴를 통해 제공됩니다. 기사는 클로드 3.5 소네트와 챗GPT를 활용해 작성되었습니다. (☞ 기사 원문 바로가기)