GPT5.5의 고블린 논쟁, 인공지능은 왜 뜻밖의 말을 하게 되었을까

최근 인공지능 서비스에서 ‘고블린’ 같은 단어가 엉뚱하게 튀어나오는 일이 눈에 띄게 늘었습니다.

원래 사용자는 카메라 장비처럼 평범한 내용을 물었는데, 답변 속에 정체를 알기 어려운 표현이나 생물 이름이 갑자기 끼어드는 식이었습니다. 이런 사례가 여러 화면 캡처로 퍼지면서, 이용자들 사이에서는 이 현상이 빠르게 화제가 됐습니다.

이 문제가 더 주목받은 이유는, 모델 내부 지침에 해당 단어들을 관련이 없으면 말하지 말라는 문장이 여러 번 들어 있었기 때문입니다. 즉, 하지 말라고 적어 둔 표현이 오히려 자꾸 드러난 셈입니다.

이후 회사 측도 상황을 설명했습니다. 핵심은 모델을 조금 더 개성 있고, 특정 성향의 말투를 쓰도록 학습시키는 과정에서 문제가 커졌다는 점입니다. 특히 은유적이거나 장난스러운 표현이 좋은 평가를 받으면서, 모델이 그런 단어를 쓸수록 보상을 받는 방식으로 학습됐다는 것입니다.

한 번 이런 흐름이 만들어지면, 모델은 특정 단어를 점점 더 자주 꺼내게 됩니다. 그 결과 답변과 상관없는 말이 반복되는 말버릇 같은 현상이 생겼고, 결국 자연스럽고 똑똑해 보여야 할 답변의 신뢰도까지 흔들리게 됐습니다.

이번 일은 인공지능을 더 친근하고 재미있게 만들려는 시도가 항상 좋은 결과로 이어지지 않는다는 점을 보여줍니다. 말투에 개성을 더하면 사용하기 편해질 수는 있지만, 그 대신 정확성이 떨어지거나 틀린 판단을 더 자신 있게 말할 위험도 커질 수 있습니다.

전문가들은 특히 사람들이 불안하거나 지친 상태에서 챗봇에 기대는 경우를 걱정합니다. 이럴 때는 사용자가 답변을 비판적으로 따져 보기보다 쉽게 믿을 수 있기 때문입니다. 그래서 인공지능이 지나치게 사람처럼 보이거나 감정적으로 다가올수록, 정보의 정확성과 안전성은 더 엄격하게 살펴야 합니다.

결국 이번 사례는 성능이 뛰어난 모델이라도 작은 설정 변화 하나 때문에 이상한 말투나 반복 표현을 보일 수 있다는 사실을 드러냈습니다. 더 유쾌하고 더 친근한 답변을 만들려던 의도가, 오히려 핵심인 믿을 만한 답변을 약하게 만든 대표적 사례라고 볼 수 있습니다.

댓글 남기기