AI 기반 온라인 범죄예고 게시글 자동검출로
서울시민 안전에 선제적 대응·민생안정 도모
온라인 범죄 예고글 급증, 익명성 악용·모방 범죄 우려…효과적 대응방안 필요
2023년 7월부터 8월 사이, ‘신림역 흉기 난동’과 ‘서현역 무차별 칼부림’과 같은 ‘묻지마 범죄’가 연이어 발생한 후 유사한 범죄를 예고하는 글들이 온라인상에서 급증했다. 경찰의 조사 결과 대부분 허위 게시글로 밝혀졌으나 이러한 글들은 주로 인터넷 커뮤니티와 공개 채팅방의 익명성을 악용했다. 또한 언론의 자극적인 관련 보도가 범죄를 부추기는 ‘범죄 감염이론’과 맞물려 모방 범죄를 증가시키는 원인이 되기도 했다. 따라서 온라인 범죄예고의 확산을 방지하고 효과적으로 대응하기 위한 연구가 필요하며, 특히 범죄예고 게시물을 실시간으로 자동 탐지하고 분석하는 시스템 개발이 중요하다.
이 연구, AI 기반 온라인 범죄예고 게시글 탐지·신고지원 시스템 구상해 제안
이 연구는 인공지능 기술을 활용해 인터넷에 유포되는 온라인 범죄예고 게시물을 자동으로 탐지하고 분석하여 알려 주는 신고지원 시스템을 [그림 1]과 같이 제안한다. 또한 데이터 수집의 신속성과 정확도 향상, 패턴 및 유형의 최적화된 분류와 탐지, 경찰과의 연계 방안을 모색하여 신속하고 효율적인 모니터링 및 신고지원 시스템을 구축하는 데 필요한 기술을 검증하고 실현 가능성을 평가한다.
AI 기반 범죄예고 탐지 시스템, 5가지 기능 마련과 다양한 소프트웨어 모듈 활용
이 연구에서 제안한 인공지능 기술 기반의 온라인 범죄예고 게시물 탐지 및 신고지원 시스템은 다섯 가지 주요 기능으로 구성되어 있다. 이 기능은 수집내용관리, 분석내용관리, 제보내용관리, 범죄용어관리, 신규예고알림으로 수집된 데이터를 효율적으로 조회하고 분석할 수 있도록 설계되었다. 이를 통해 신속하고 정확한 범죄예고 게시물의 탐지와 분석이 가능하다.
시스템의 주요 소프트웨어 모듈은 다음과 같다. 데이터 수집을 위해 Selenium과 SerpAPI를 활용한 수집 모듈, MariaDB를 기반으로 한 데이터베이스, OCR 및 KIWI 라이브러리를 사용한 전처리 모듈, BERT, GPT, NER 등 다양한 AI 모델을 활용한 분석 모듈이 포함된다. 또한 Java, Springboot, Vue, Nginx를 활용하여 웹 모듈이 구축되었다.
시스템은 온라인 커뮤니티와 SNS에서 게시글을 수집하여 데이터베이스에 저장한 뒤 OCR 기술을 활용해 이미지에서 텍스트를 추출하고, 이를 전처리하여 AI 모델을 통해 범죄예고 게시물 여부를 탐지한다. 탐지된 게시물은 범죄 유형을 자동으로 태깅(tagging)하고, 핵심 정보를 추출하여 분석 결과로 제공된다. 관리자 웹 페이지에서는 수집 및 분석된 데이터를 조회하고, 필요에 따라 내용을 수정할 수 있다. 또한 중요도가 높은 게시물은 승인 과정을 거쳐 프론트 웹 페이지에 공개된다. 이를 통해 신속하고 효율적인 모니터링과 신고 지원이 가능해져, 공공 안전을 크게 향상시키는 데 기여할 수 있다.