- AI Sparkup
- Posts
- Salesforce CEO가 3년 쓰던 ChatGPT를 2시간 만에 버린 이유 ⚡
Salesforce CEO가 3년 쓰던 ChatGPT를 2시간 만에 버린 이유 ⚡
PLUS: 코딩 1위 달성한 Claude의 가격 80% 인하, MIT가 측정한 인간 사고의 시간당 비용, 7B로 GPT-4o 이긴 온디바이스 AI, Cursor가 40조원 평가받는 진짜 이유
"3년 동안 매일 쓰던 ChatGPT를 버리겠다"는 말, 그것도 700억 달러 규모 기업의 CEO가 공개적으로 선언했습니다. Salesforce CEO Marc Benioff가 구글의 Gemini 3를 단 2시간 써보고는 이렇게 말했죠. "세상이 다시 바뀐 것 같다. 나는 돌아가지 않을 거다."
Gemini 3가 출시 24시간 만에 100만 사용자를 모으며 AI 업계 판도를 뒤흔드는 사이, Anthropic은 최고 성능과 가격 80% 인하라는 파격 조합으로 반격했습니다. 한편 MIT는 인간의 생각에 처음으로 가격표를 붙였고, Microsoft는 작은 모델로 거대 모델을 이기는 법을 보여줬습니다. AI 시장의 1강 체제가 무너지는 결정적 순간들을 포착했습니다.
Today's AI Spark⚡:
Salesforce CEO의 ChatGPT 이탈이 보여주는 AI 시장 대전환
Claude Opus 4.5의 성능 1위 + 가격 80% 인하 전략
MIT가 측정한 인간 사고의 경제적 가치: 시간당 8만원
7B 파라미터로 GPT-4o를 이긴 온디바이스 AI의 혁명
Model Lab과 Agent Lab의 근본적 차이
Salesforce CEO가 3년 쓰던 ChatGPT를 2시간 만에 버린 충격

Gemini 3가 보여준 압도적 성능이 AI 시장 판도를 흔들고 있다 (출처: Futurism)
Salesforce CEO Marc Benioff가 구글의 Gemini 3를 2시간 사용한 후 "3년간 매일 쓰던 ChatGPT로 돌아가지 않겠다"고 공개 선언했습니다. 출시 24시간 만에 100만 사용자를 모은 Gemini 3는 LMArena에서 사상 최초로 1500점을 돌파하며 거의 모든 영역에서 1위를 차지했죠.
OpenAI 독주 체제의 종말:
경쟁사들도 인정한 게임 체인저: OpenAI CEO Sam Altman과 xAI CEO Elon Musk가 공개적으로 축하 메시지 전송. 업계 1위와 2위가 3위의 성과를 축하하는 이례적 장면
Microsoft·Nvidia의 배신: 같은 날 OpenAI 경쟁사 Anthropic에 총 150억 달러 투자하며 기업가치 1,830억→3,500억 달러로 급등. 가장 가까운 파트너들마저 대안 찾기 시작
사용자 격차 빠르게 축소: Gemini 앱 월 6.5억 vs ChatGPT 주 8억 사용자. 구글의 검색 시장 선점 덕분에 시장 점유율 뺏기 가속화
Claude Opus 4.5, 코딩 벤치마크 1위 달성하고 가격은 80% 내렸다
AI 모델이 더 똑똑해지면 가격도 올라간다는 공식을 Anthropic이 깼습니다. 11월 24일 출시된 Claude Opus 4.5는 AI 코딩 벤치마크에서 업계 최고 성능을 기록하면서도 API 가격을 대폭 인하했거든요.
성능과 가격의 역설적 조합:
실전 코딩 능력 80.9% 달성: 실제 깃허브 이슈 해결 능력 측정하는 SWE-bench Verified에서 업계 1위. Gemini 3.0 Pro(75.1%)를 압도하며 10건 중 8건을 제대로 처리
입력 50%, 출력 80% 가격 인하: 입력 100만 토큰당 $5, 출력 100만 토큰당 $15로 책정. 최고 성능을 이 가격에 쓸 수 있다는 건 AI 활용의 경제성을 완전히 바꾸는 변화
Chrome·Excel 직접 제어 추가: "이 웹사이트에서 데이터 수집해서 스프레드시트로 정리해줘" 한 마디로 브라우저 열고, 데이터 추출하고, Excel 정리까지 자동 처리
인간의 생각 비용은 시간당 8만원: MIT가 측정한 AI 시대의 경제학
MIT 연구팀이 처음으로 인간의 "사고 비용"을 정량화했습니다. 결과는 시간당 약 $60, 한화로 약 8만원. 이는 단순히 흥미로운 숫자가 아니라 AI와 인간의 협업을 설계할 때 언제 AI를 쓰고 언제 인간이 판단해야 하는지 결정하는 중요한 경제적 기준점입니다.
생각에도 가격표가 붙는 시대:
시간당 $60에 생각 포기: 참가자들에게 "생각 안 하고 대충 답하기"를 선택하면 보상을 주는 실험. 보상 금액을 올려가며 언제 생각을 포기하는지 관찰한 결과 시간당 $60이 분기점
GPT-4o는 시간당 $15: 인간 사고 비용의 4분의 1 수준. 방사선 판독은 AI가, 복잡한 법률 자문은 인간이 맡는 식으로 경제적 의사결정의 새로운 기준 제시
측정할 수 없는 가치들: 창의성, 직관, 윤리적 판단 같은 인간 사고의 다른 측면은 미포함. 순수한 인지적 노력의 비용만 측정했지만 AI 시대 인간 역할 재정의의 중요한 출발점
7B 파라미터로 GPT-4o를 이긴 비결: Microsoft의 온디바이스 AI 혁명
AI가 웹사이트를 탐색하고 폼을 작성하려면 GPT-4o 같은 거대 모델이 필요했고, 민감한 데이터를 클라우드로 보내야 했습니다. Microsoft가 이 두 문제를 동시에 해결한 Fara-7B를 공개했습니다.
작지만 강력한, 그리고 안전한:
웹 내비게이션 73.5% 성공률: 70억 파라미터만으로 GPT-4o(65.1%)와 동급 모델(66.4%)을 모두 제쳐. 스크린샷만으로 브라우저 제어하며 평균 16단계 만에 작업 완료
여러분의 PC에서 직접 실행: NPU 탑재 기기에서 빠르게 작동하며 클라우드 전송 불필요. 금융 데이터나 내부 계정 관리 시 민감 정보 유출 위험 제로
14만 5천 개 합성 데이터의 마법: Magentic-One 멀티 에이전트 시스템으로 생성한 100만 단계 데이터를 7B 모델 하나로 압축. 숙련된 팀의 노하우를 한 명의 전문가에게 전수한 것과 같은 효과
Cursor가 40조원 평가받는 진짜 이유: Agent Lab의 시대가 왔다
"GPT Wrapper"라는 비난을 받던 기업들이 이제 놀라운 성과를 내고 있습니다. 코드 에디터 Cursor는 $29B(약 40조원), AI 검색 Perplexity는 $20B, AI 코딩 어시스턴트 Cognition은 $10B로 평가받죠. 단순한 래퍼치고는 너무 큰 숫자입니다.
Model Lab과 근본적으로 다른 비즈니스:
연구 대 제품의 선택: OpenAI는 컴퓨팅의 72%를 연구에 투입하지만 Cursor는 2년간 자체 모델 연구 없이 제품 완성도에 집중. 순서가 완전히 다른 접근법
토큰이 아닌 성과로 과금: Model Lab이 토큰 단위 가격 경쟁에 휘말리는 동안 Agent Lab은 "이 작업 완성했으니 얼마" 식으로 실제 비즈니스 가치로 값 책정. Factory AI의 월 $2,000가 합리적인 이유
강화학습 시대의 승자: 인터넷 텍스트 학습이 한계에 도달하며 특정 도메인 반복 학습이 핵심. Cursor는 오픈소스 모델에 자체 사후학습으로 프론티어 모델 격차 상당 부분 축소
이것도 놓치지 마세요 ✨
이 뉴스레터에서 다루지 못한 주목할 만한 소식들입니다:
🤖 AI 모델 & 기술
🔧 AI 개발 & 도구
💼 AI 비즈니스 & 서비스
🎨 AI 콘텐츠 & 미디어
⚠️ AI 안전 & 윤리
AI Sparkup에서 매일 업데이트되는 최신 AI 뉴스와 인사이트를 놓치지 마세요. aisparkup.com에서 더 많은 정보를 확인하실 수 있습니다.