구글이 안전성 평가 결과 없이 먼저 슬롯사이트 업를 출시한 뒤 뒤늦게 간략한 보고서를 공개하자, 전문가들 사이에서 안전성과 투명성 후퇴를 둘러싼 우려가 커지고 있다.
![구글의 슬롯사이트 업 보고서가 논란이 됐다.[사진=셔터스톡]](https://cdn.fortunekorea.co.kr/news/photo/202504/47778_40852_1349.jpg)
구글이 최신 인공지능(슬롯사이트 업) 모델 ‘제미니 2.5 Pro’의 개발 및 안전성 평가 관련 정보를 담은 문서를 모델 출시 3주 만에 뒤늦게 공개했다. 해당 문서는 ‘모델 카드(model card)’ 형식으로 제미니 2.5 Pro가 어떤 방식으로 만들어졌고 어떤 테스트를 거쳤는지를 간략히 요약하고 있다.
문제는 이 모델 카드의 공개 시점과 그 내용 모두 슬롯사이트 업 거버넌스 전문가의 비판을 사고 있다는 점이다. 구글은 앞서 미국 정부와 여러 국제 슬롯사이트 업 안전 회의에서 자사의 슬롯사이트 업 모델 출시 시 안전성 평가 결과와 리스크에 대한 문서를 함께 제공하겠다고 약속했다. 그런데 이번 공개 방식은 그 약속을 어긴 것 아니냐는 지적이 나왔다.
구글 대변인은 이메일 성명을 통해 “회사가 약속을 저버렸다는 주장은 사실과 다르다”면서 “향후 최종 버전이 공개될 때 보다 상세한 기술 보고서가 함께 제공될 예정”이라고 설명했다.
다만 이번에 공개된 6쪽 분량의 모델 카드에 대해서도 전문가들의 불만은 이어졌다. 미국 워싱턴DC 기반 싱크탱크 민주주의기술센터(Center for Democracy and Technology)의 슬롯사이트 업 거버넌스 선임 고문 케빈 뱅크스턴은 SNS 플랫폼 X를 통해 “이 정도 수준의 문서로 구글의 최상위 슬롯사이트 업 모델을 설명하겠다는 건, 슬롯사이트 업 안전성과 투명성 측면에서 위험한 ‘하향 경쟁(race to the bottom)’을 보여주는 사례”라고 비판했다.
뱅크스턴은 특히 모델 출시 시점보다 3주나 늦게 문서가 공개됐다는 점, 그리고 핵심 안전 평가 결과가 빠져 있다는 점을 문제로 지적했다. 예컨대 슬롯사이트 업 모델이 생화학 무기 제조법처럼 위험한 출력을 하도록 유도하는 ‘레드팀(red-teaming)’ 테스트 결과가 누락돼 있다는 점을 두고 “구글이 해당 모델을 출시하기 전에 안전성 테스트를 끝내지 않았거나, 아직도 완료하지 않았다는 것을 시사한다”고 말했다.
그는 또 다른 가능성으로 “구글이 이미 테스트를 마쳤지만, 전체 사용자에게 모델을 공개하기 전까지는 관련 평가 결과를 제공하지 않기로 방침을 정했을 수도 있다”고 봤다. 현재 제미니 2.5 Pro는 정식 출시 전 ‘프리뷰(preview)’ 버전으로, 구글 슬롯사이트 업 스튜디오와 구글랩스를 통해 제한된 기능으로 사용이 가능하다. 구글은 이 모델을 미국 내 대학생에게도 폭넓게 제공하고 있다.
구글 측은 각 모델군별로 한 번씩만 종합적인 슬롯사이트 업 안전 보고서를 발행할 계획이라고 밝혔다. 이에 뱅크스턴은 “이 말은 곧 코드 작성용이나 사이버보안 특화형처럼 파인튜닝된 모델에 대한 개별 평가 결과는 더 이상 공개하지 않겠다는 의미일 수 있다”고 우려했다. 파인튜닝된 모델은 기반 모델과는 전혀 다른 성격을 보일 수 있기 때문에, 개별 평가 없이 공개될 경우 위험성이 더 클 수 있다는 거다.
‘슬롯사이트 업 안전성 후퇴’ 논란은 구글만 문제가 되는 게 아니다. 메타가 최근 출시한 라마(Llama) 4 모델의 모델 카드도 내용이 간략하다는 이유로 비슷한 비판을 받았다. 오픈슬롯사이트 업도 최근 GPT-4.1 모델에 대해 “전략적 핵심 모델(frontier model)이 아니다”라는 이유로 별도의 안전성 기술 보고서를 발행하지 않겠다고 밝혔다.
오픈슬롯사이트 업는 GPT-4.1이 기존 GPT-4o보다 성능이 높다고 설명했지만, 이 모델이 위험 수위를 초과하는지 여부는 불투명하다. GPT-4o의 경우 위험성이 “출시 불가 수준에는 미치지 않는다”고 명시한 기술 보고서가 있었던 반면, GPT-4.1은 그러한 자료조차 공개되지 않은 상태다.
오픈슬롯사이트 업는 o3 및 o4-mini 모델에 대해서는 기술 안전 보고서를 발간했다. 동시에 슬롯사이트 업 위험 평가 체계인 ‘Preparedness Framework’도 업데이트했다. 이 체계는 슬롯사이트 업가 생물무기 개발을 돕는 위험부터 자율적으로 진화해 인간 통제를 벗어날 가능성까지 포괄적으로 평가하는 기준이다.
그러나 이번 개정에서 ‘설득(persuasion)’, 즉 슬롯사이트 업가 인간에게 해로운 행동을 유도하거나 허위 정보를 믿게 만드는 능력이 위험 평가 항목에서 제외됐다. 반면 ‘심각한 위험이 있어도 경쟁사가 비슷한 모델을 먼저 출시했다면 자사 모델을 출시할 수 있다’는 조항이 새롭게 추가되면서 논란이 일고 있다.
이를 두고 슬롯사이트 업 거버넌스 전문가들의 평가는 엇갈린다. 평가 기준을 명확히 공개했다는 점에서 오픈슬롯사이트 업의 투명성을 높이 평가하는 이들도 있지만, 위험 기준을 완화한 것에 관한 우려의 목소리도 커지고 있다.
/ 글 Jeremy Kahn, Beatrice Nolan & 편집 문상덕 기자 mosadu@fortunekorea.co.kr