AMD가 임베디드 기기에서 AI 처리 역량을 극대화한 버설(Versal) AI 엣지/프라임 2세대 SoC(시스템반도체)를 내년 하반기 출시한다.
버설 AI 엣지/프라임 2세대는 AI 처리를 위해 신호를 수집하는 전처리, 추론, 후처리 등 모든 작업을 단일 칩으로 처리한다. Arm이 지난 해 공개한 자동차용 IP(지적재산권)인 코어텍스-A78AE와 코어텍스 R52를 이용해 온도와 전력 등 임베디드 환경 내구성을 확보했다.
■ 임베디드 환경에서 AI 처리시 환경적 제약 ↑
스테프 고티에(Steph Gauthier) AMD 적응형 및 임베디드 컴퓨팅 그룹 버설 시리즈 수석 매니저는 사전 브리핑에서 "AI 처리 역량을 임베디드 기기에 적용하려면 여러 가지 도전 과제에 직면한다"고 설명했다.
이어 "임베디드 환경은 온도와 전력 소모, 크기 등에 제약을 받으며 실시간 구동되는 환경에서 보안과 안전성, 신뢰성을 확보해야 한다. 여기에 AI 처리 기능까지 더하며 상당한 제약 조건이 존재한다"고 덧붙였다.
현재 시스템에서 AI 관련 기능을 처리하려면 추론에 필요한 영상이나 음성, 센서의 각종 신호를 처리하는 전처리, AI 엔진이 실제로 구동되는 신경망 기반 추론, 추론 결과를 바탕으로 각종 모터나 센서를 구동하는 과정 등 3단계를 거친다.
■ 전처리·AI 추론·후처리 과정 여러 칩에 분산
스테프 고티에 수석 매니저는 "전처리 과정에서 하드웨어 기반 가속 기능이 작동하지 않으면 처리 과정에서 병목 현상이 일어나며 보다 적은 자원으로 이를 처리하는 프로그래머블 로직(PL)을 이용해 이를 해결할 수 있다"고 말했다.
전처리를 통해 수집한 데이터를 기반으로 추론 작업을 실행할 때는 고성능 프로세서 기반 벡터 연산이 필요하다. 스테프 고티에 수석 매니저는 "지금까지 나온 솔루션 중 대부분은 전처리나 벡터 연산 등 최대 두 개만 처리 가능한 것이 한계"라고 밝혔다.
이어 "현재 구조로는 여러 개 칩을 탑재해야 하는데 더 큰 기판을 적용하면서 시스템 크기와 메모리 용량, 전력 소모가 모두 늘어난다. 칩 사이 데이터 전송시 지연시간도 발생하며 고장 요인과 보안 취약점도 늘어난다"고 덧붙였다.
■ 각종 SoC 통합해 전력 소모·복잡성 최소화
버설 AI 엣지/프라임 2세대는 전처리와 추론, 후처리 등 3개 동작을 한 번에 처리할 수 있도록 각종 SoC를 통합했다. 전처리 과정에는 프로그래머블 로직과 메모리/입출력에 필요한 IP를 기본 내장해 전력 소모를 줄였다.
추론은 벡터 연산에 최적화된 차세대 엔진을 이용한다. 신경망 처리에 흔히 쓰이는 파이토치, 텐서플로 등을 모두 지원하며 독자 개발 모델도 쓸 수 있다.
스테프 고티에 수석 매니저는 "스마트시티 솔루션의 이미지 처리에서 전세대 대비 보드 면적은 그대로 유지하며 초당 30fps 영상처리가 가능하다"고 설명했다.
후처리 과정에는 Arm 코어텍스-A78AE와 코어텍스-R52 코어를 이용한다. 자동차 탑재 기준인 ASIL(자동차 안전 무결성 수준)을 만족해 자동차 등 환경에서 안정적으로 작동한다.
■ 스바루, ADAS 기능에 버설 AI 엣지 2세대 적용
관련기사
- AMD, 오픈소스 업스케일링 기술 'FSR 3.1' 공개2024.03.22
- AMD "오픈소스 동영상 플레이어 'VLC', 플루이드 모션 곧 지원"2024.03.14
- AMD, 6세대 FPGA '스파르탄 울트라스케일+' 내년 하반기 출시2024.03.05
- AMD, 라데온 RX 7700 XT 그래픽카드 가격 소폭 인하2024.02.27
마누엘 엄(Manuel Uhm) AMD 버설 제품 마케팅 디렉터는 "주된 용도가 ADAS 제어용이 될 것"이라고 설명했다. 실제로 완성차 업체 스바루는 카메라 3대로 구현된 ADAS 기능인 아이사이트(EyeSight)에 버설 AI 엣지 2세대를 도입할 예정이다.
버설 AI 엣지/프라임 2세대 관련 문서는 오늘(9일)부터 신청한 개발자에 제공된다. 실리콘에 이를 구현한 시제품은 내년 상반기, 평가 키트는 내년 중반 제공되며 실제 제품은 내년 하반기 출시 예정이다.