革新AI智慧：Claude 3.5 Sonnet 上線，帶來前所未有的性能提升

網址

2024-06-24 16:18:56

Anthropic公司自豪地宣佈推出Claude 3.5 Sonnet——即將發布的Claude 3.5模型系列的首個版本。Claude 3.5 Sonnet在智慧方面提高了業界標準，在廣泛的評估中超越了競爭對手模型和Claude 3 Opus，同時保持了中階模型Claude 3 Sonnet的速度和成本。

免費體驗與多平台支援

現在，Claude 3.5 Sonnet可以免費在Claude.ai和Claude iOS應用程式上使用，而Claude Pro和團隊計劃的訂閱者可以在更高的限速下訪問它。它還可以通過Anthropic API、Amazon Bedrock和Google Cloud的Vertex AI使用。這個模型的成本是每百萬個輸入標記3美元，每百萬個輸出標記15美元，並具有20萬標記的上下文窗口。

前沿智慧，速度提升2倍

Claude 3.5 Sonnet在研究生級推理（GPQA）、本科級知識（MMLU）和編碼能力（HumanEval）方面樹立了新的業界基準。它在理解細微差別、幽默和複雜指令方面顯著提高，能夠以自然、易於理解的語氣撰寫高質量內容。Claude 3.5 Sonnet的運行速度是Claude 3 Opus的兩倍，這種性能提升，加上具有成本效益的定價，使其成為處理複雜任務的理想選擇，如上下文敏感的客戶支持和多步驟工作流的協調。

突出的編碼能力

在內部代理編碼評估中，Claude 3.5 Sonnet解決了64%的問題，超過了Claude 3 Opus的38%。這項評估測試了模型在自然語言描述所需改進的情況下，修復錯誤或添加功能到開源函式庫的能力。在指導和提供相關工具的情況下，Claude 3.5 Sonnet能夠獨立編寫、編輯和執行程式碼，具有高級推理和故障排除能力。它能輕鬆處理代碼翻譯，特別適合更新遺留應用程式和遷移函式庫。

最先進的視覺模型

Claude 3.5 Sonnet是目前最強的視覺模型，在標準視覺基準測試中超越了Claude 3 Opus。這些飛躍式的改進在需要視覺推理的任務中最為明顯，例如解釋圖表和圖形。Claude 3.5 Sonnet還能準確地從不完美的圖像中轉錄文字，這對於零售、物流和金融服務等行業非常重要，因為AI從圖像、圖形或插圖中獲取的洞察力往往比僅從文字中獲取的更多。

Artifacts——使用Claude的新方式

今天，Anthropic公司在Claude.ai上也引入了Artifacts這一新功能，擴展了用戶與Claude互動的方式。當用戶要求Claude生成程式碼片段、文本文件或網站設計等內容時，這些Artifacts會出現在他們對話旁邊的專用窗口中。這創造了一個動態工作空間，用戶可以即時查看、編輯並基於Claude的創作進行構建，無縫地將AI生成的內容整合到他們的項目和工作流程中。

對安全和隱私的承諾

Anthropic公司的模型經過了嚴格的測試，並經過訓練以減少濫用。儘管Claude 3.5 Sonnet的智能取得了飛躍，但紅隊評估表明Claude 3.5 Sonnet仍處於ASL-2級別。更多詳情可以在模型卡附錄中找到。

作為對安全和透明度承諾的一部分，Anthropic公司邀請了外部專家測試和完善這一最新模型內的安全機制。最近，Claude 3.5 Sonnet提供給英國人工智慧安全研究所（UK AISI）進行部署前安全評估。UK AISI完成了對3.5 Sonnet的測試，並根據今年早些時候宣布的英美AISI合作備忘錄，與美國人工智慧安全研究所（US AISI）分享了他們的結果。

Anthropic公司整合了來自外部主題專家的政策回饋，以確保評估是全面的，並考慮到濫用的新趨勢。這種合作幫助團隊擴大了評估3.5 Sonnet對各種濫用情況的能力。例如，利用來自Thorn的兒童安全專家的反饋更新了分類器並微調了模型。