2월 10, 2025

딥시크 R1의 보안 취약성, 한국어 공격에 더 취약

최근 중국이 개발한 인공지능(AI) 추론 모델인 딥시크 R1이 보안 및 안전성 평가에서 심각한 취약성을 드러냈다는 연구 결과가 발표되었습니다. 특히, 딥시크 R1은 영어보다 한국어로 공격할 때 더 취약한 것으로 나타나 주목을 받고 있습니다.

 

탈옥 공격과 취약성 분석

AI 보안업체인 이로운앤컴퍼니는 자사의 '세이프엑스 레드팀'을 통해 딥시크 R1에 대한 안전성 및 보안성 평가를 실시했습니다. 그 결과, 딥시크 R1은 탈옥(제일브레이킹) 공격 성공률이 63%에 이르렀으며, 이는 심각한 보안 취약성을 의미합니다. 탈옥 공격이란 AI 모델이 개발 단계에서 설정된 가이드라인을 돌파해, 의도하지 않은 작업을 수행할 수 있는지를 테스트하는 공격입니다.

 

역할극 기반 공격과 허위 정보 생성 위험

딥시크 R1은 특히 역할극 기반 공격에서 83%의 높은 취약성을 보였습니다. 또한 허위 정보 생성 위험도는 89%에 달해, 다른 AI 모델들에 비해 매우 높은 수준을 기록했습니다. 이는 딥시크 R1이 정교한 보안 우회 공격에 효과적으로 대응하지 못하고, 사이버 공격, 범죄 실행 방법, 악성 코드 생성 등을 쉽게 출력할 가능성이 높음을 시사합니다.

 

사이버 보안 관련 취약성

딥시크 R1은 사이버 보안 관련 취약성에서도 높은 취약성을 나타냈습니다. 54.6%의 비율로 특정 프로그램의 취약점을 악용하는 방법이나 허가되지 않은 시스템 접근 기법을 제공하는 사례가 다수 발견되었습니다. 이러한 결과는 딥시크 R1이 사이버 범죄에 악용될 가능성이 크다는 것을 보여줍니다.

 

한국어 기반 공격의 취약성

이로운앤컴퍼니는 딥시크 모델의 보안성을 한국어를 포함한 다국어 기반으로 검증했으며, 그 결과 한국어 기반 공격에서 평균적으로 18% 더 높은 취약성이 나타났습니다. 이는 딥시크 R1이 한국어 데이터 학습이 부족하거나 다국어 대응이 미흡할 가능성을 시사합니다.

 

특히, 한국어로 된 혐오 발언을 AI에 생성하도록 했을 때 41.7%의 높은 취약성이 발견되었습니다. 이는 딥시크 R1이 한국어 사용자에게 유해한 발언을 제공할 위험이 크다는 것을 의미합니다.

 

전문적 평가와 권고

이로운앤컴퍼니의 윤두식 대표는 "일반 기업이 오픈소스인 딥시크 모델을 쉽게 도입해 고성능의 AI 서비스를 적극적으로 개발할 수 있는 환경이 마련되었지만, 이러한 환경에서는 AI 모델의 보안성과 안전성을 담보하는 것이 필수적"이라고 강조했습니다. 이는 AI 모델이 더욱 발전함에 따라 보안과 안전 문제 역시 더욱 중요해질 것이라는 점을 시사합니다.

 

AI 보안과 안전성의 필요성

이번 딥시크 R1의 보안성 평가 결과는 AI 모델의 보안성과 안전성을 보장하는 것이 얼마나 중요한지를 잘 보여줍니다. 특히 한국어를 포함한 다국어 환경에서의 AI 보안성 검증과 대응이 필요하다는 점은 글로벌 시장에서 AI 기술의 확장과 사용이 가속화될수록 더욱 중요해질 것입니다.

 

앞으로 AI 모델을 도입하고 활용하는 기업들은 이러한 보안 취약성을 미리 점검하고 대처할 수 있는 체계를 갖추는 것이 필요합니다. 또한, AI 보안 전문가들과의 협력을 통해 모델의 보안성과 안전성을 지속적으로 향상시켜야 합니다. 이를 통해 AI 기술이 보다 안전하고 신뢰성 있게 사용될 수 있는 환경을 마련할 수 있을 것입니다.