Anthropic公司自豪地宣佈推出Claude 3.5 Sonnet——即將發布的Claude 3.5模型系列的首個版本。Claude 3.5 Sonnet在智慧方面提高了業界標準,在廣泛的評估中超越了競爭對手模型和Claude 3 Opus,同時保持了中階模型Claude 3 Sonnet的速度和成本。
免費體驗與多平台支援
現在,Claude 3.5 Sonnet可以免費在Claude.ai和Claude iOS應用程式上使用,而Claude Pro和團隊計劃的訂閱者可以在更高的限速下訪問它。它還可以通過Anthropic API、Amazon Bedrock和Google Cloud的Vertex AI使用。這個模型的成本是每百萬個輸入標記3美元,每百萬個輸出標記15美元,並具有20萬標記的上下文窗口。
前沿智慧,速度提升2倍
Claude 3.5 Sonnet在研究生級推理(GPQA)、本科級知識(MMLU)和編碼能力(HumanEval)方面樹立了新的業界基準。它在理解細微差別、幽默和複雜指令方面顯著提高,能夠以自然、易於理解的語氣撰寫高質量內容。Claude 3.5 Sonnet的運行速度是Claude 3 Opus的兩倍,這種性能提升,加上具有成本效益的定價,使其成為處理複雜任務的理想選擇,如上下文敏感的客戶支持和多步驟工作流的協調。
突出的編碼能力
在內部代理編碼評估中,Claude 3.5 Sonnet解決了64%的問題,超過了Claude 3 Opus的38%。這項評估測試了模型在自然語言描述所需改進的情況下,修復錯誤或添加功能到開源函式庫的能力。在指導和提供相關工具的情況下,Claude 3.5 Sonnet能夠獨立編寫、編輯和執行程式碼,具有高級推理和故障排除能力。它能輕鬆處理代碼翻譯,特別適合更新遺留應用程式和遷移函式庫。
最先進的視覺模型
Claude 3.5 Sonnet是目前最強的視覺模型,在標準視覺基準測試中超越了Claude 3 Opus。這些飛躍式的改進在需要視覺推理的任務中最為明顯,例如解釋圖表和圖形。Claude 3.5 Sonnet還能準確地從不完美的圖像中轉錄文字,這對於零售、物流和金融服務等行業非常重要,因為AI從圖像、圖形或插圖中獲取的洞察力往往比僅從文字中獲取的更多。
Artifacts——使用Claude的新方式
今天,Anthropic公司在Claude.ai上也引入了Artifacts這一新功能,擴展了用戶與Claude互動的方式。當用戶要求Claude生成程式碼片段、文本文件或網站設計等內容時,這些Artifacts會出現在他們對話旁邊的專用窗口中。這創造了一個動態工作空間,用戶可以即時查看、編輯並基於Claude的創作進行構建,無縫地將AI生成的內容整合到他們的項目和工作流程中。
對安全和隱私的承諾
Anthropic公司的模型經過了嚴格的測試,並經過訓練以減少濫用。儘管Claude 3.5 Sonnet的智能取得了飛躍,但紅隊評估表明Claude 3.5 Sonnet仍處於ASL-2級別。更多詳情可以在模型卡附錄中找到。
作為對安全和透明度承諾的一部分,Anthropic公司邀請了外部專家測試和完善這一最新模型內的安全機制。最近,Claude 3.5 Sonnet提供給英國人工智慧安全研究所(UK AISI)進行部署前安全評估。UK AISI完成了對3.5 Sonnet的測試,並根據今年早些時候宣布的英美AISI合作備忘錄,與美國人工智慧安全研究所(US AISI)分享了他們的結果。
Anthropic公司整合了來自外部主題專家的政策回饋,以確保評估是全面的,並考慮到濫用的新趨勢。這種合作幫助團隊擴大了評估3.5 Sonnet對各種濫用情況的能力。例如,利用來自Thorn的兒童安全專家的反饋更新了分類器並微調了模型。
即將推出
Anthropic公司的目標是每隔幾個月就大幅改善智慧、速度和成本之間的折衷。為了完成Claude 3.5模型系列,將在今年晚些時候發布Claude 3.5 Haiku和Claude 3.5 Opus。
除了開發下一代模型系列,Anthropic公司還在開發新功能和特性,以支持更多的業務用例,包括與企業應用的整合。團隊也在探索記憶功能,這將使Claude能夠記住用戶的偏好和互動歷史,從而使體驗更加個性化和高效。
Anthropic公司不斷致力於改進Claude,並熱愛聽取用戶的回饋。用戶可以在產品中直接提交對Claude 3.5 Sonnet的回饋,以幫助開發路線圖,並改善使用體驗。正如以往一樣,期待看到用戶使用Claude所建立、創造和發現的一切。