• AI Sparkup
  • Posts
  • Salesforce CEO가 3년 쓰던 ChatGPT를 2시간 만에 버린 이유 ⚡

Salesforce CEO가 3년 쓰던 ChatGPT를 2시간 만에 버린 이유 ⚡

PLUS: 코딩 1위 달성한 Claude의 가격 80% 인하, MIT가 측정한 인간 사고의 시간당 비용, 7B로 GPT-4o 이긴 온디바이스 AI, Cursor가 40조원 평가받는 진짜 이유

"3년 동안 매일 쓰던 ChatGPT를 버리겠다"는 말, 그것도 700억 달러 규모 기업의 CEO가 공개적으로 선언했습니다. Salesforce CEO Marc Benioff가 구글의 Gemini 3를 단 2시간 써보고는 이렇게 말했죠. "세상이 다시 바뀐 것 같다. 나는 돌아가지 않을 거다."

Gemini 3가 출시 24시간 만에 100만 사용자를 모으며 AI 업계 판도를 뒤흔드는 사이, Anthropic은 최고 성능과 가격 80% 인하라는 파격 조합으로 반격했습니다. 한편 MIT는 인간의 생각에 처음으로 가격표를 붙였고, Microsoft는 작은 모델로 거대 모델을 이기는 법을 보여줬습니다. AI 시장의 1강 체제가 무너지는 결정적 순간들을 포착했습니다.

Today's AI Spark⚡:
  • Salesforce CEO의 ChatGPT 이탈이 보여주는 AI 시장 대전환

  • Claude Opus 4.5의 성능 1위 + 가격 80% 인하 전략

  • MIT가 측정한 인간 사고의 경제적 가치: 시간당 8만원

  • 7B 파라미터로 GPT-4o를 이긴 온디바이스 AI의 혁명

  • Model Lab과 Agent Lab의 근본적 차이

Salesforce CEO가 3년 쓰던 ChatGPT를 2시간 만에 버린 충격

Gemini 3 출시

Gemini 3가 보여준 압도적 성능이 AI 시장 판도를 흔들고 있다 (출처: Futurism)

Salesforce CEO Marc Benioff가 구글의 Gemini 3를 2시간 사용한 후 "3년간 매일 쓰던 ChatGPT로 돌아가지 않겠다"고 공개 선언했습니다. 출시 24시간 만에 100만 사용자를 모은 Gemini 3는 LMArena에서 사상 최초로 1500점을 돌파하며 거의 모든 영역에서 1위를 차지했죠.

OpenAI 독주 체제의 종말:

  • 경쟁사들도 인정한 게임 체인저: OpenAI CEO Sam Altman과 xAI CEO Elon Musk가 공개적으로 축하 메시지 전송. 업계 1위와 2위가 3위의 성과를 축하하는 이례적 장면

  • Microsoft·Nvidia의 배신: 같은 날 OpenAI 경쟁사 Anthropic에 총 150억 달러 투자하며 기업가치 1,830억→3,500억 달러로 급등. 가장 가까운 파트너들마저 대안 찾기 시작

  • 사용자 격차 빠르게 축소: Gemini 앱 월 6.5억 vs ChatGPT 주 8억 사용자. 구글의 검색 시장 선점 덕분에 시장 점유율 뺏기 가속화

Claude Opus 4.5, 코딩 벤치마크 1위 달성하고 가격은 80% 내렸다

AI 모델이 더 똑똑해지면 가격도 올라간다는 공식을 Anthropic이 깼습니다. 11월 24일 출시된 Claude Opus 4.5는 AI 코딩 벤치마크에서 업계 최고 성능을 기록하면서도 API 가격을 대폭 인하했거든요.

성능과 가격의 역설적 조합:

  • 실전 코딩 능력 80.9% 달성: 실제 깃허브 이슈 해결 능력 측정하는 SWE-bench Verified에서 업계 1위. Gemini 3.0 Pro(75.1%)를 압도하며 10건 중 8건을 제대로 처리

  • 입력 50%, 출력 80% 가격 인하: 입력 100만 토큰당 $5, 출력 100만 토큰당 $15로 책정. 최고 성능을 이 가격에 쓸 수 있다는 건 AI 활용의 경제성을 완전히 바꾸는 변화

  • Chrome·Excel 직접 제어 추가: "이 웹사이트에서 데이터 수집해서 스프레드시트로 정리해줘" 한 마디로 브라우저 열고, 데이터 추출하고, Excel 정리까지 자동 처리

인간의 생각 비용은 시간당 8만원: MIT가 측정한 AI 시대의 경제학

MIT 연구팀이 처음으로 인간의 "사고 비용"을 정량화했습니다. 결과는 시간당 약 $60, 한화로 약 8만원. 이는 단순히 흥미로운 숫자가 아니라 AI와 인간의 협업을 설계할 때 언제 AI를 쓰고 언제 인간이 판단해야 하는지 결정하는 중요한 경제적 기준점입니다.

생각에도 가격표가 붙는 시대:

  • 시간당 $60에 생각 포기: 참가자들에게 "생각 안 하고 대충 답하기"를 선택하면 보상을 주는 실험. 보상 금액을 올려가며 언제 생각을 포기하는지 관찰한 결과 시간당 $60이 분기점

  • GPT-4o는 시간당 $15: 인간 사고 비용의 4분의 1 수준. 방사선 판독은 AI가, 복잡한 법률 자문은 인간이 맡는 식으로 경제적 의사결정의 새로운 기준 제시

  • 측정할 수 없는 가치들: 창의성, 직관, 윤리적 판단 같은 인간 사고의 다른 측면은 미포함. 순수한 인지적 노력의 비용만 측정했지만 AI 시대 인간 역할 재정의의 중요한 출발점

7B 파라미터로 GPT-4o를 이긴 비결: Microsoft의 온디바이스 AI 혁명

AI가 웹사이트를 탐색하고 폼을 작성하려면 GPT-4o 같은 거대 모델이 필요했고, 민감한 데이터를 클라우드로 보내야 했습니다. Microsoft가 이 두 문제를 동시에 해결한 Fara-7B를 공개했습니다.

작지만 강력한, 그리고 안전한:

  • 웹 내비게이션 73.5% 성공률: 70억 파라미터만으로 GPT-4o(65.1%)와 동급 모델(66.4%)을 모두 제쳐. 스크린샷만으로 브라우저 제어하며 평균 16단계 만에 작업 완료

  • 여러분의 PC에서 직접 실행: NPU 탑재 기기에서 빠르게 작동하며 클라우드 전송 불필요. 금융 데이터나 내부 계정 관리 시 민감 정보 유출 위험 제로

  • 14만 5천 개 합성 데이터의 마법: Magentic-One 멀티 에이전트 시스템으로 생성한 100만 단계 데이터를 7B 모델 하나로 압축. 숙련된 팀의 노하우를 한 명의 전문가에게 전수한 것과 같은 효과

Cursor가 40조원 평가받는 진짜 이유: Agent Lab의 시대가 왔다

"GPT Wrapper"라는 비난을 받던 기업들이 이제 놀라운 성과를 내고 있습니다. 코드 에디터 Cursor는 $29B(약 40조원), AI 검색 Perplexity는 $20B, AI 코딩 어시스턴트 Cognition은 $10B로 평가받죠. 단순한 래퍼치고는 너무 큰 숫자입니다.

Model Lab과 근본적으로 다른 비즈니스:

  • 연구 대 제품의 선택: OpenAI는 컴퓨팅의 72%를 연구에 투입하지만 Cursor는 2년간 자체 모델 연구 없이 제품 완성도에 집중. 순서가 완전히 다른 접근법

  • 토큰이 아닌 성과로 과금: Model Lab이 토큰 단위 가격 경쟁에 휘말리는 동안 Agent Lab은 "이 작업 완성했으니 얼마" 식으로 실제 비즈니스 가치로 값 책정. Factory AI의 월 $2,000가 합리적인 이유

  • 강화학습 시대의 승자: 인터넷 텍스트 학습이 한계에 도달하며 특정 도메인 반복 학습이 핵심. Cursor는 오픈소스 모델에 자체 사후학습으로 프론티어 모델 격차 상당 부분 축소

이것도 놓치지 마세요 ✨

이 뉴스레터에서 다루지 못한 주목할 만한 소식들입니다:

🤖 AI 모델 & 기술

🔧 AI 개발 & 도구

💼 AI 비즈니스 & 서비스

🎨 AI 콘텐츠 & 미디어

⚠️ AI 안전 & 윤리

AI Sparkup에서 매일 업데이트되는 최신 AI 뉴스와 인사이트를 놓치지 마세요. aisparkup.com에서 더 많은 정보를 확인하실 수 있습니다.