AI 학습용 무단 크롤링 논란, 미디어·플랫폼 간 저작권 공방 확산

뉴욕타임즈(The New York Times, 이하 NYT)가 생성형 AI 검색 서비스 ‘퍼플렉티(Perplexity AI)’를 상대로 저작권 침해 소송을 제기했다. NYT는 퍼플렉서티가 자신들의 기사·영상·팟캐스트 등을 무단 크롤링해 서비스 학습에 활용했을 뿐 아니라, 이용자 질의에 NYT 기사와 “동일하거나 실질적으로 유사한” 결과물을 그대로 내보냈다고 주장한다. NYT는 약 2년에 걸쳐 반복적으로 중단을 요구했지만 시정이 없었다고 밝혔다.

💡
크롤링(crawling)은 웹사이트에 공개된 정보를 자동화된 프로그램(크롤러·봇·스파이더)이 방문하며 수집하는 기술을 말한다. 검색엔진, 데이터 분석, AI 학습 등 다양한 서비스의 기초가 되는 핵심 과정으로, 웹(web)을 돌아다니며 필요한 데이터를 긁어오는 자동 수집 기술이다.