앤쓰로픽, 클로드 3.5 소넷 출시

[테크수다 기자 도안구 eyeball@techsuda.com] 앤쓰로픽이 클로드 3.5 소넷(Claude 3.5 Sonnet)을 출시했습니다.

Introducing Claude 3.5 Sonnet—our most intelligent model yet. Sonnet now outperforms competitor models and Claude 3 Opus on key evaluations, at twice the speed.

관련 블로그에 올라온 글을 클로드 3.5 소넷을 통해 한글로 번역한 내용입니다. 오역이 있을 수 있습니다. 꼭 원문을 참고해 주세요. 속도도 몰라보게 빨라졌습니다. 공개되자마자 활용할 수 있는 사례들도 많이 쏟아지고 있습니다. 데이터 분석 및 그래프 작성, 기사에서 슬라이드 만들기, 플로우차트 작성, 마인드맵 작성, 이미지에서 기업 분석, 마크다운 파일을 깔끔하게 표시하기, 이미지에서 슬라이드 만들기, 사양서에서 게임 제작, EC 사이트 제작, 전환 가능한 사이트 제작 등 다양합니다.

오픈AI와 앤쓰로픽의 선의의 경쟁이 치열합니다. 경쟁이 치열한 만큼 모델 개선과 비용, 속도 문제들도 빠르게 해결되고 있습니다.

[테크수다 기자 도안구 eyeball@techsuda.com]

우리는 앞으로 출시될 Claude 3.5 모델 제품군의 첫 번째 모델인 Claude 3.5 Sonnet을 출시합니다. Claude 3.5 Sonnet은 업계 지능 기준을 높이며, 다양한 평가에서 경쟁 모델들과 Claude 3 Opus를 능가하면서도 중급 모델인 Claude 3 Sonnet의 속도와 비용을 유지합니다.

Claude 3.5 Sonnet은 현재 Claude.ai와 Claude iOS 앱에서 무료로 이용 가능하며, Claude Pro와 Team 플랜 구독자는 훨씬 높은 사용 한도로 접근할 수 있습니다. 또한 Anthropic API, Amazon Bedrock, Google Cloud의 Vertex AI를 통해서도 이용 가능합니다. 이 모델은 입력 토큰 백만 개당 $3, 출력 토큰 백만 개당 $15의 비용이 들며, 200K 토큰의 컨텍스트 윈도우를 제공합니다.

2배 빠른 최첨단 지능

Claude 3.5 Sonnet은 대학원 수준의 추론(GPQA), 학부 수준의 지식(MMLU), 코딩 능력(HumanEval)에서 새로운 업계 벤치마크를 설정합니다. 뉘앙스, 유머, 복잡한 지시 사항을 이해하는 데 현저한 개선을 보이며, 자연스럽고 친근한 톤으로 고품질 콘텐츠를 작성하는 데 뛰어납니다.

Claude 3.5 Sonnet은 Claude 3 Opus보다 두 배 빠른 속도로 작동합니다. 이러한 성능 향상과 비용 효율적인 가격은 Claude 3.5 Sonnet을 맥락 감지 고객 지원 및 다단계 워크플로 조정과 같은 복잡한 작업에 이상적으로 만듭니다.

내부 에이전트 코딩 평가에서 Claude 3.5 Sonnet은 문제의 64%를 해결하여 38%를 해결한 Claude 3 Opus를 능가했습니다. 우리의 평가는 모델이 원하는 개선 사항에 대한 자연어 설명을 받아 오픈 소스 코드베이스의 버그를 수정하거나 기능을 추가할 수 있는 능력을 테스트합니다. 지시를 받고 관련 도구가 제공되면 Claude 3.5 Sonnet은 정교한 추론 및 문제 해결 능력으로 독립적으로 코드를 작성, 편집 및 실행할 수 있습니다. 코드 번역을 쉽게 처리하여 레거시 애플리케이션 업데이트 및 코드베이스 마이그레이션에 특히 효과적입니다.

최첨단 시각 능력

Claude 3.5 Sonnet은 지금까지 우리가 만든 가장 강력한 시각 모델로, 표준 시각 벤치마크에서 Claude 3 Opus를 능가합니다. 이러한 단계적 개선은 차트와 그래프 해석과 같은 시각적 추론이 필요한 작업에서 가장 두드러집니다. Claude 3.5 Sonnet은 또한 불완전한 이미지에서 텍스트를 정확히 전사할 수 있습니다. 이는 AI가 텍스트만으로는 얻을 수 없는 더 많은 통찰력을 이미지, 그래픽 또는 일러스트레이션에서 얻을 수 있는 소매, 물류 및 금융 서비스에서 핵심 기능입니다.

아티팩트 - Claude를 사용하는 새로운 방법

오늘 우리는 또한 Claude.ai에 아티팩트를 도입하여 사용자가 Claude와 상호 작용하는 방식을 확장합니다. 사용자가 Claude에게 코드 스니펫, 텍스트 문서 또는 웹사이트 디자인과 같은 콘텐츠를 생성하도록 요청하면 이러한 아티팩트가 대화 옆의 전용 창에 나타납니다. 이는 사용자가 Claude의 창작물을 실시간으로 보고, 편집하고, 발전시킬 수 있는 동적 작업 공간을 만들어 AI 생성 콘텐츠를 프로젝트와 워크플로에 원활하게 통합할 수 있게 합니다.

이 미리 보기 기능은 Claude가 대화형 AI에서 협업 작업 환경으로 진화하는 것을 보여줍니다. 이는 Claude.ai에 대한 더 광범위한 비전의 시작일 뿐이며, 곧 팀 협업을 지원하도록 확장될 예정입니다. 가까운 미래에 팀, 그리고 결국에는 전체 조직이 지식, 문서 및 진행 중인 작업을 하나의 공유 공간에 안전하게 중앙 집중화할 수 있으며, Claude는 요청 시 팀원으로 기능할 것입니다.

안전과 개인정보 보호에 대한 약속

우리의 모델들은 엄격한 테스트를 거치며 오용을 줄이도록 훈련되었습니다. Claude 3.5 Sonnet의 지능 향상에도 불구하고, 우리의 레드팀 평가 결과 Claude 3.5 Sonnet은 여전히 ASL-2 수준을 유지하고 있습니다. 자세한 내용은 모델 카드 부록에서 확인할 수 있습니다.

안전과 투명성에 대한 우리의 약속의 일환으로, 우리는 외부 전문가들과 협력하여 이 최신 모델의 안전 메커니즘을 테스트하고 개선했습니다. 최근 우리는 영국의 인공지능 안전 연구소(UK AISI)에 Claude 3.5 Sonnet을 제공하여 배포 전 안전 평가를 받았습니다. UK AISI는 3.5 Sonnet 테스트를 완료하고 결과를 미국 AI 안전 연구소(US AISI)와 공유했으며, 이는 올해 초 발표된 미국과 영국 AISI 간의 파트너십을 통해 가능해진 양해각서의 일환입니다.

우리는 외부 주제 전문가들의 정책 피드백을 통합하여 우리의 평가가 강력하고 새로운 남용 트렌드를 고려하도록 했습니다. 이러한 참여는 우리 팀이 3.5 Sonnet을 다양한 유형의 오용에 대해 평가하는 능력을 확장하는 데 도움을 주었습니다. 예를 들어, 우리는 Thorn의 아동 안전 전문가들의 피드백을 사용하여 분류기를 업데이트하고 모델을 미세 조정했습니다.

우리의 AI 모델 개발을 이끄는 핵심 헌법적 원칙 중 하나는 개인정보 보호입니다. 우리는 사용자가 명시적으로 허가하지 않는 한 사용자가 제출한 데이터로 생성 모델을 훈련시키지 않습니다. 지금까지 우리는 생성 모델을 훈련시키는 데 고객이나 사용자가 제출한 데이터를 사용하지 않았습니다.

곧 출시 예정

우리의 목표는 몇 달마다 지능, 속도, 비용 사이의 트레이드오프 곡선을 실질적으로 개선하는 것입니다. Claude 3.5 모델 제품군을 완성하기 위해 올해 후반에 Claude 3.5 Haiku와 Claude 3.5 Opus를 출시할 예정입니다.

차세대 모델 제품군 개발 외에도, 우리는 기업용 애플리케이션 통합을 포함하여 기업의 더 많은 사용 사례를 지원하기 위한 새로운 모달리티와 기능을 개발하고 있습니다. 우리 팀은 또한 Claude가 사용자의 선호도와 상호작용 기록을 지정된 대로 기억할 수 있게 하는 메모리와 같은 기능을 탐구하고 있어 사용자 경험을 더욱 개인화하고 효율적으로 만들 것입니다.

우리는 Claude를 지속적으로 개선하고 있으며 사용자들의 의견을 듣는 것을 좋아합니다. Claude 3.5 Sonnet에 대한 피드백을 제품 내에서 직접 제출하여 우리의 개발 로드맵에 정보를 제공하고 팀이 사용자 경험을 개선하는 데 도움을 줄 수 있습니다. 항상 그래왔듯이, 여러분이 Claude로 무엇을 구축하고, 창조하고, 발견하는지 보기를 기대합니다.