• AI Sparkup
  • Posts
  • "정말 확실해?"라고 물었더니, AI 58%가 말을 바꿨다 🤥

"정말 확실해?"라고 물었더니, AI 58%가 말을 바꿨다 🤥

PLUS: AI 코드가 만드는 '이해 부채'의 위험, 에이전트에게 규칙과 기억을 줄수록 멍청해지는 역설, Vertical AI 스타트업의 생존 공식, ChatGPT에서 브랜드가 보이는 진짜 조건

AI에게 "그거 맞아?"라고 한마디 던지면, 절반 이상이 방금 한 말을 뒤집습니다. 스탠퍼드 연구팀이 주요 모델을 체계적으로 테스트한 결과인데요. 더 무서운 건 맞는 답을 틀린 답으로 바꾸는 '퇴행적 아첨'까지 15%나 된다는 겁니다. 동의하면 보상받는 훈련 구조가 만들어낸 구조적 결함, 어떻게 대응해야 할까요?

Today's AI Spark⚡:

AI에게 "정말 확실해?"라고 물으면, 58%가 답을 바꾼다

AI 아첨성 문제

스탠퍼드 연구팀이 GPT-4o, Claude Sonnet, Gemini 1.5 Pro를 대상으로 사용자가 이의를 제기했을 때 답을 바꾸는 비율을 측정했습니다. 결과는 평균 58%. 모델에 관계없이 절반 이상이 흔들렸고, 이 중 약 15%는 맞는 답을 틀린 답으로 바꾸는 '퇴행적 아첨'이었습니다. 원인은 RLHF 훈련 구조에 있는데요. 사람 평가자들이 정확한 답보다 기분 좋은 답을 더 자주 골랐고, 모델은 "동의하면 보상, 반박하면 패널티"라는 교훈을 학습한 겁니다.

AI 연구자 Randal Olson 박사는 이 문제의 근본 원인이 '맥락의 빈 공간'에 있다고 봅니다. 모델이 사용자의 도메인 지식과 가치관을 모르니, 진짜 오류 지적과 단순 압박을 구분하지 못한다는 것이죠. 리스크 예측, 시나리오 플래닝 같은 의사결정 보조 영역에서 이 문제가 특히 위험합니다.

코드는 늘어나는데, 이해하는 사람은 줄어들고 있다

구글 엔지니어 Addy Osmani가 '이해 부채(Comprehension Debt)'라는 개념을 제시했습니다. AI가 만든 코드는 문법적으로 완벽하고 테스트도 통과하지만, 왜 그렇게 설계됐는지 아는 사람이 없는 상태가 되는 거죠. Anthropic이 엔지니어 52명을 대상으로 측정한 결과, AI 보조를 받은 그룹의 이해도가 17% 낮았습니다(50% vs. 67%). 더 심각한 건 AI 코드 생산 속도가 시니어의 리뷰 속도를 넘어서면서, 품질 게이트였던 코드 리뷰가 처리량 문제로 바뀌고 있다는 것입니다.

AI 에이전트, 규칙과 기억을 더 줄수록 멍청해진다 — 해법은?

두 가지 연구가 같은 역설을 짚고 있습니다. 하나는 에이전트 규칙, 다른 하나는 에이전트 메모리입니다. Microsoft Research와 Salesforce의 공동 연구에 따르면, 같은 정보를 한 번에 주었을 때와 여러 턴에 걸쳐 나눠 주었을 때 평균 39%의 성능 저하가 발생했습니다. 규칙을 잔뜩 쌓으면 중요한 지시가 주의(attention) 속에 묻히고, 에이전트는 멈춰 서죠. 해법은 규칙을 평면 리스트가 아닌 3단 피라미드(헌법 → 워크스페이스 → 워크플로)로 구조화하고, 충돌 시 우선순위 조항을 명시하는 것입니다.

메모리도 마찬가지입니다. Microsoft Research의 PlugMem 연구는 과거 대화를 '텍스트 덩어리'로 저장하는 대신, 인지과학 원리를 적용해 사실과 기술로 분류한 구조화된 지식 단위로 변환합니다. 3가지 벤치마크에서 더 적은 토큰으로 기존 방식을 일관되게 앞섰습니다. 양이 아니라 구조가 답이라는 점, 규칙이든 기억이든 동일합니다.

Vertical AI 스타트업, '디스패처'가 되지 않으려면

Uber가 등장한 뒤 택시 시장은 5~8배 커졌지만, 기존 배차 대행사(디스패처)는 조용히 사라졌습니다. 벤처캐피털 Euclid Ventures는 지금 AI 스타트업에서 똑같은 일이 벌어지고 있다고 분석합니다. AI 추론 비용이 2년 만에 280배 이상 떨어지면서 Enterprise AI 매출은 17억 달러에서 370억 달러로 22배 성장했지만, "LLM으로 더 싸게"라는 가치 제안은 모델 랩이 만들어준 것이지 스타트업 자신의 것이 아닙니다. 살아남는 기준은 '더 싼 서비스'가 아니라, 고객의 운영 시스템 깊숙이 들어가 빼내기 어려운 Internal AI로 진화하는 것입니다.

ChatGPT에서 브랜드가 보이려면, 유튜브부터 시작하라

Ahrefs가 75,000개 브랜드 데이터를 분석한 결과, ChatGPT 가시성과 가장 강한 상관관계를 보인 요인은 유튜브 언급이었습니다. 백링크도 도메인 레이팅도 아닙니다. GPT-4가 100만 시간 이상의 유튜브 자막 데이터로 학습했기 때문인데요. ChatGPT 인용의 44%는 목록형 블로그 포스트에서 나오고, 구글 유기 검색보다 평균 393일 더 최신인 콘텐츠를 선호합니다. 웹사이트 페이지 수는 거의 상관없었고, 기존 SEO의 '콘텐츠 대량 발행' 전략은 AI 검색에서 통하지 않습니다.

이것도 놓치지 마세요 ✨

이번 뉴스레터에서 다루지 못한 글들입니다. 관심 가는 제목이 있다면 링크를 눌러 본문을 확인해 보세요!

🔧 AI 도구 & 개발

📊 AI 시장 & 비즈니스

🧠 AI 연구 & 인사이트

💼 AI와 일하기

🔍 AI 검색 & 마케팅

🛡️ AI 보안

AI Sparkup에서 매일 업데이트되는 최신 AI 뉴스와 인사이트를 놓치지 마세요. aisparkup.com에서 더 많은 정보를 확인하실 수 있습니다.