革新AI智慧:Claude 3.5 Sonnet 上線,帶來前所未有的性能提升

Anthropic公司自豪地宣佈推出Claude 3.5 Sonnet——即將發布的Claude 3.5模型系列的首個版本。Claude 3.5 Sonnet在智慧方面提高了業界標準,在廣泛的評估中超越了競爭對手模型和Claude 3 Opus,同時保持了中階模型Claude 3 Sonnet的速度和成本。

免費體驗與多平台支援

現在,Claude 3.5 Sonnet可以免費在Claude.ai和Claude iOS應用程式上使用,而Claude Pro和團隊計劃的訂閱者可以在更高的限速下訪問它。它還可以通過Anthropic API、Amazon Bedrock和Google Cloud的Vertex AI使用。這個模型的成本是每百萬個輸入標記3美元,每百萬個輸出標記15美元,並具有20萬標記的上下文窗口。

前沿智慧,速度提升2倍

Claude 3.5 Sonnet在研究生級推理(GPQA)、本科級知識(MMLU)和編碼能力(HumanEval)方面樹立了新的業界基準。它在理解細微差別、幽默和複雜指令方面顯著提高,能夠以自然、易於理解的語氣撰寫高質量內容。Claude 3.5 Sonnet的運行速度是Claude 3 Opus的兩倍,這種性能提升,加上具有成本效益的定價,使其成為處理複雜任務的理想選擇,如上下文敏感的客戶支持和多步驟工作流的協調。

突出的編碼能力

在內部代理編碼評估中,Claude 3.5 Sonnet解決了64%的問題,超過了Claude 3 Opus的38%。這項評估測試了模型在自然語言描述所需改進的情況下,修復錯誤或添加功能到開源函式庫的能力。在指導和提供相關工具的情況下,Claude 3.5 Sonnet能夠獨立編寫、編輯和執行程式碼,具有高級推理和故障排除能力。它能輕鬆處理代碼翻譯,特別適合更新遺留應用程式和遷移函式庫。

最先進的視覺模型

Claude 3.5 Sonnet是目前最強的視覺模型,在標準視覺基準測試中超越了Claude 3 Opus。這些飛躍式的改進在需要視覺推理的任務中最為明顯,例如解釋圖表和圖形。Claude 3.5 Sonnet還能準確地從不完美的圖像中轉錄文字,這對於零售、物流和金融服務等行業非常重要,因為AI從圖像、圖形或插圖中獲取的洞察力往往比僅從文字中獲取的更多。

Artifacts——使用Claude的新方式

今天,Anthropic公司在Claude.ai上也引入了Artifacts這一新功能,擴展了用戶與Claude互動的方式。當用戶要求Claude生成程式碼片段、文本文件或網站設計等內容時,這些Artifacts會出現在他們對話旁邊的專用窗口中。這創造了一個動態工作空間,用戶可以即時查看、編輯並基於Claude的創作進行構建,無縫地將AI生成的內容整合到他們的項目和工作流程中。

對安全和隱私的承諾

Anthropic公司的模型經過了嚴格的測試,並經過訓練以減少濫用。儘管Claude 3.5 Sonnet的智能取得了飛躍,但紅隊評估表明Claude 3.5 Sonnet仍處於ASL-2級別。更多詳情可以在模型卡附錄中找到。

作為對安全和透明度承諾的一部分,Anthropic公司邀請了外部專家測試和完善這一最新模型內的安全機制。最近,Claude 3.5 Sonnet提供給英國人工智慧安全研究所(UK AISI)進行部署前安全評估。UK AISI完成了對3.5 Sonnet的測試,並根據今年早些時候宣布的英美AISI合作備忘錄,與美國人工智慧安全研究所(US AISI)分享了他們的結果。

Anthropic公司整合了來自外部主題專家的政策回饋,以確保評估是全面的,並考慮到濫用的新趨勢。這種合作幫助團隊擴大了評估3.5 Sonnet對各種濫用情況的能力。例如,利用來自Thorn的兒童安全專家的反饋更新了分類器並微調了模型。

即將推出

Anthropic公司的目標是每隔幾個月就大幅改善智慧、速度和成本之間的折衷。為了完成Claude 3.5模型系列,將在今年晚些時候發布Claude 3.5 Haiku和Claude 3.5 Opus。

除了開發下一代模型系列,Anthropic公司還在開發新功能和特性,以支持更多的業務用例,包括與企業應用的整合。團隊也在探索記憶功能,這將使Claude能夠記住用戶的偏好和互動歷史,從而使體驗更加個性化和高效。

Anthropic公司不斷致力於改進Claude,並熱愛聽取用戶的回饋。用戶可以在產品中直接提交對Claude 3.5 Sonnet的回饋,以幫助開發路線圖,並改善使用體驗。正如以往一樣,期待看到用戶使用Claude所建立、創造和發現的一切。

 

課程推薦

AI工作術全面學習實戰營:6 堂精選課程,學會最好用 AI 工具,翻轉你的人生

AI工作術全面學習實戰營:6 堂精選課程,學會最好用 AI 工具,翻轉你的人生

《PChome雜誌》攜手 5 位在 AI 領域的專業講師,打造上述 6 堂實用課程,教你學會時下最好用的 AI 工具,導入生成式 AI 來產製工作內容,改造並升級你的工作流程。

輸入折扣碼 ZERO2024 還可以額外獲得 NT$400 優惠喔。

HTML與SEO實戰應用—並以ChatGPT助力提升網站品質與流量

HTML與SEO實戰應用—並以ChatGPT助力提升網站品質與流量

本課程專為希望深入了解 HTML 並有效結合 SEO 策略的學員設計。我們將重點放在 HTML 的深度學習與應用上,同時穿插介紹如何透過搜索引擎優化提升網站能見度。透過即時互動式的直播教學,加上 ChatGPT 的輔助,您將學習到如何建立一個結構優良、美觀且符合 SEO 標準的網站。這不僅會提升網站的用戶體驗,還會大幅提高網站的搜索引擎排名,進而增加訪客流量和潛在客戶。
用AI強化職場競爭力 ChatGPT、Midjourney從入門到精通

用AI強化職場競爭力 ChatGPT、Midjourney從入門到精通

在快速變遷的職場中,提升競爭力成為關鍵。透過引領潮流的AI技術,ChatGPT和Midjourney將助您勇攀高峰。無論您是AI新手還是專家,這個課程將引導您從入門到精通,解密AI的奧秘,並學習如何運用於職場。
GitHub Copilot AI 程式碼編輯工具應用實務班

GitHub Copilot AI 程式碼編輯工具應用實務班

讓學員瞭解有效地使用該工具來加速開發流程、提高程式碼品質和生產力。課程重點放在以 JavaScript 程式語言為例,介紹 Copilot 的基本原理、使用方法和最佳實踐。

輸入折扣碼 TC1456JA 還可以額外獲得 NT$500 優惠喔。

ChatGPT X Clipchamp AI 生成影片、配音與字幕應用實戰班

ChatGPT X Clipchamp AI 生成影片、配音與字幕應用實戰班

掌握Clipchamp AI的操作技巧,靈活運用Clipchamp AI進行影片編輯和創作,實現創意表達和傳播目的。

輸入折扣碼 TC1451JAN 還可以額外獲得 NT$500 優惠喔。

如何串接多種數位工具資訊?Looker Studio 資料視覺化實戰班|GoogleAds x FB廣告 x GA流量數據

如何串接多種數位工具資訊?Looker Studio 資料視覺化實戰班|GoogleAds x FB廣告 x GA流量數據

Looker Studio除了可協助使用者監控網站流量、廣告成效、選擇匯入資源的管道之外,還可以將數據資料多平台整合、數據報表即時更新、數據範本可重複套用的效益,透過自動化系統,將數據全部匯入同一個報表平台,是企業不可或缺的重要工具。

輸入折扣碼 TC1270JIA 還可以額外獲得 NT$500 優惠喔。

和我們交流

加入我們的社群,裡面會有一些技術的內容、有趣的技術梗,以及職缺的分享,歡迎和我們一起討論。