거리의 간판·표지판·낙서까지 모두 '검색'할 수 있다면?
데이터 저널리스트이자 엔지니어인 맷 다니엘스(Matt Daniels)가 이런 궁금증을 풀기 위해 흥미로운 실험을 진행했다. 이 실험 결과는 IT 전문미디어 기가진을 통해 소개됐다.
맷 다이넬스가 사용한 도구는 ‘all text in nyc’라는 검색 엔진이다. 미디어 아티스트 유펑 자오(Yufeng Zhao)가 제작한 이 서비스는 2007년부터 2024년까지 18년간 구글 스트리트뷰에 기록된 뉴욕의 파노라마 사진 800만 장을 수집하고, 광학문자인식(OCR) 기술로 그 속의 글자를 추출했다.
총 1억3천800만 건의 문자 스니펫(키워드에 대한 정보나 대답을 보여주는 글)이 데이터베이스에 담겼다. 다만, 구글 스트리트뷰 차량이 촬영할 수 없는 골목이나 공원 안의 글자, 혹은 너무 작아 판독이 어려운 글자는 포함되지 않았다.

단어로 보는 뉴욕의 풍경
다니엘스는 이 방대한 데이터를 바탕으로, 뉴욕 거리에 어떤 단어가 얼마나 자주 등장하는지 분석했다. 결과는 도시의 성격과 지역별 특성을 그대로 보여줬다.
PIZZA(11만1천290건)
지도 위 주황색 점이 뉴욕 전역을 뒤덮다시피 했다. “뉴욕은 피자의 도시”라는 말이 데이터로 증명됐다.

BROADWAY(6만2천424건)
주로 도로 표지판에서 발견됐고, 이름에 ‘브로드웨이’가 들어간 여러 거리 주변에 집중됐다.
LUXURY(1만6천731건)
신축 아파트와 고급 건물에서 주로 발견됐다. 다만 거리 전체가 ‘럭셔리’로 도배된 곳은 허드슨 야드뿐이었다.

BEWARE(1만419건)
주로 울타리나 잔디밭이 있는 주택가에서 발견됐다. 맨해튼에 거의 없는 이유가 여기에 있다.
GOLD(5만1천353건)
맨해튼 다이아몬드 지구와 금·보석 매입 상점들이 모여 있는 거리에서 집중적으로 나타났다.

뉴욕 거리, 'STOP' 등 경고 문구 다수 차지...'신경 쓰지 마' 단어도
뉴욕 거리에서 자주 보이는 표현 중에는 'Fuhgeddaboudit'(Forget about it, 신경 쓰지 마) 같은 유머러스한 구절도 있었지만, 경고 문구가 상당한 비중을 차지했다.
도로 위 낙서로는 ‘ACAB’가 많았고, 공원에서는 'No Ball Playing'(공놀이 금지) 표지판이 자주 발견됐다.

가장 많이 등장한 단어는 'STOP'으로, 무려 113만6천962건에 달했다. 뒤이어 'One Way'(일방통행)가 82만8천362건으로 2위를 차지했다. 상위 30위 중 21개 단어가 교통 표지판 관련이었다.
관련기사
- 내가 그동안 ‘줌 회의’가 유독 불편했던 이유2025.03.20
- "당신은 왜 AI를 친절히 대하나요?"2025.03.02
- 고학력자들이 치매에 더 취약한 이유2025.06.22
- "악몽 자주 시달리면 더 빨리 늙고 죽는다"2025.07.06
또 'Surveillance'(감시)라는 단어도 492위에 올랐다. 경찰, 기업, 공원 관리소 등이 CCTV 설치 사실을 안내하는 표지판에서 자주 발견됐다. 다니엘스는 “감시 경고 문구는 뉴욕 시민에게 너무 익숙해서 일종의 시각적 배경음처럼 느껴진다”고 말했다.
외신은 "이 프로젝트는 문자 데이터가 단순한 언어 정보가 아니라, 도시의 문화·경제·사회적 풍경을 비추는 거울이 될 수 있음을 보여준다"고 말했다.