클로드 오푸스 4.8의 실제 테스트 결과: 그는 일을 훨씬 더 잘하지만, 그의 말은 훨씬 더 가혹하다.
카테고리

클로드 오푸스 4.8의 실제 테스트 결과: 그는 일을 훨씬 더 잘하지만, 그의 말은 훨씬 더 가혹하다.

오늘 아침, Anthropic은 공식적으로 OpenAI를 제치고 새로운 기업 가치를 발표했으며, 지난 이틀 동안 소문으로만 떠돌던 주력 제품 라인인 Claude Opus의 최신 버전 4.8을 출시했습니다.
Jun 1st,2026 3 견해
   오늘 아침, Anthropic은 공식적으로 OpenAI를 제치고 새로운 기업 가치를 발표했으며, 지난 이틀 동안 소문으로만 떠돌던 주력 제품 라인인 Claude Opus의 최신 버전 4.8을 출시했습니다. 저희는 즉시 이 제품을 입수하여 사용자 커뮤니티로부터 초기 피드백을 수집했습니다. 결론은 다음과 같습니다. 기능은 향상되었지만, "개성" 때문에 사용하기가 더 어려워졌습니다. APPSO 테스트: 두뇌는 업그레이드되었지만, 입은 사라졌습니다. 저희는 Anthropic이 준비한 벤치마크 시나리오 대신 실제 요구 사항을 적용하여 테스트했습니다. 온라인 협업 플랫폼에서 과거 대화 기록을 모두 추출하고 보관하는 작업이었습니다. 데이터 용량은 30MB가 넘었고, 프런트엔드 인터페이스 곳곳에 흩어져 있었으며, 바로 내보낼 수 있는 버튼도 없었습니다. 이러한 유형의 작업은 모델의 코딩 능력을 테스트하는 것이 아니라, 비전문 개발자와 협력하여 처음부터 작업을 파악하고 완료할 수 있는지 여부를 테스트하는 것입니다. 이 작업은 우연한 발견에서 시작되었습니다. 테스트 담당자가 플랫폼의 프런트엔드 인터페이스에서 특정 순간에 과거 기록이 잠깐 나타났다가 사라지는 현상을 발견했습니다. 마치 데이터가 클라이언트에 잠깐 로드되었다가 바로 삭제되는 것 같았습니다. 그는 이 관찰 내용을 4.8 버전 개발팀에 전달하면서 기술적인 설명은 전혀 하지 않고, 단순히 "예전 메시지가 잠깐 나타났다가 사라지는 것을 봤습니다."라고만 말했습니다.
   4.8 그의 의도를 이해하고 정확한 판단을 내렸습니다. 데이터는 인터페이스 요청을 통해 로드되며 브라우저의 네트워크 계층에서 가로챌 수 있다는 것이었습니다. 그런 다음 개발자 도구, 네트워크 패널, 키워드 필터링, 대상 요청 위치 파악 등의 단계를 안내하는 실행 계획을 제시했습니다. 판단은 정확했고 사고 과정도 명확했습니다. 하지만 4.8의 모순은 바로 여기에 있습니다. 사고력은 뛰어나지만 표현 방식이… 장황하다는 것입니다. 모든 기술적 해결책은 정확하지만 각 단계에 대한 설명은 두세 문장이나 필요합니다. 어떤 방법에 대해 질문하면 먼저 "물론이죠! 단계별로 설명해 드리겠습니다."라고 답한 다음, 항목별 목록을 제시하고, 목록 끝에 왜 이렇게 해야 하는지에 대한 "보충 설명"을 덧붙입니다. 세 문장으로 설명할 수 있는 내용을 세 화면 분량의 텍스트로 설명하는 것입니다. 제가 코딩을 잘 못하는 것뿐이지, 머리가 이상해진 것은 아닙니다.
   이 문제는 4.8 버전에서만 나타나는 새로운 문제가 아니라, Opus 시리즈 4.7 버전부터 존재해 온 고질적인 문제입니다. 반복적인 비판에도 불구하고 이번 버전에서도 개선되지 않았고, 오히려 더 악화된 것으로 보입니다. 가장 시간이 많이 소요되는 부분은 오류 수정 단계입니다. 첫 번째 해결책을 제시한 후 사용자가 오류를 발견하는 경우, 4.8 버전은 문제를 정확하게 파악하고 새로운 해결책을 제공하며, 실패했던 단계를 반복하지 않습니다. 이는 여러 차례의 오류 수정 과정에서도 이전에 시도했던 단계를 잊어버리는 경우가 있었던 4.6 버전보다는 확실히 개선된 점입니다. 실수를 인정하는 것은 좋지만, 지나치게 경직될 필요는 없습니다. 원인 분석과 항목별 목록을 추가하면 기술적인 문제 검토 문서임에도 불구하고 마치 고객 서비스 이메일처럼 느껴집니다.
   최종적으로 데이터는 HAR 형식으로 완벽하게 내보내졌으며, 사용자 지정 스크립트를 사용한 데이터 정리 및 레이어링 작업도 모두 성공적으로 완료되었습니다. 일부 사용자는 아직 Claude Code 업데이트를 받지 못했지만, Chrome용 Claude는 이미 4.8 버전으로 업데이트되었으며 Notion과 같은 주요 오피스 도구에도 배포되었습니다. 저희는 Chrome에서 Claude를 사용하여 검색 및 양식 작성과 같은 기본적인 작업을 테스트했습니다.

관련 뉴스

저희와 함께 일할 준비가 되셨나요?

문의하기