中信建投(601066)發(fā)布研報稱,Mythos是Anthropic迄今最強模型,能力出現躍遷式增強,代碼、推理與研究輔助全面領先前代。其在真實網絡安全(885459)場景中優(yōu)勢最突出,不僅在Firefox漏洞利用任務中遠超Opus4.6,還可發(fā)現并利用零日漏洞。此外,Mythos在生化研發(fā)及金融、AI訓練、機器人等行業(yè)研發(fā)流程中也具備明顯加速作用。Anthropic背后由亞馬遜(AMZN)、谷歌(GOOG)投資與算力供給,并在近期加強合作,2027年起TPU需求量達到3.5g(885556)W,谷歌(GOOG)TPU產業(yè)鏈有望持續(xù)受益于前沿模型訓練需求擴張。
中信建投主要觀點如下:
1.迄今最強模型,能力出現躍遷式增強。Claude Mythos被Anthropic定義為“迄今最強大AI模型”,能力曲線出現了明顯躍遷。其在軟件工程、推理、知識工作和研究輔助等多個維度明顯強于Opus4.6。以代碼能力為例,Mythos在SWE-bench Verified上達到93.9%,顯著高于Opus4.6的80.8%;價格方面,其API定價達到25美元/百萬輸入token和125美元/百萬輸出token,約為Opus4.6的5倍。
2.Cyber(指一個模型或系統(tǒng)在執(zhí)行與網絡空間相關的任務時所展現的技術水平)能力極強,尤其在真實場景中出現斷層式領先。Mythos在更貼近真實世界的Firefox漏洞利用任務中,總成功率達到84.0%,其中完整漏洞利用成功率達到72.4%,遠高于Opus4.6的15.2%。同時,Mythos還能在真實系統(tǒng)中發(fā)現并利用零日漏洞,典型案例是挖出存在27年的OpenBSD漏洞,說明其cyber能力已從“會做安全題”躍遷到“能在真實環(huán)境中找洞并利用漏洞”。
3.在生化研發(fā)與多行業(yè)研發(fā)流程中均具備明顯放大作用。除cyber外,Mythos在化學、生物及更廣泛研發(fā)場景中的價值也開始清晰顯現。在生化領域,其對公開文獻、實驗流程、多步驟protocol和生物序列設計/功能預測的整合能力明顯增強;在更廣泛產業(yè)端,其在Kernel task、LLM training等任務上也明顯強于前代,部分任務已達到數小時到40小時級別人類工時等價,有望加速生物醫(yī)藥、金融量化、AI基礎設施、機器人和自動駕駛等多個行業(yè)的研發(fā)流程升級。
4.對齊能力當前最好,但低頻出錯的風險更大。Mythos是其迄今“總體最對齊”的模型。經過后訓練后,模型在破壞性行為、作弊式行為以及對人類濫用請求的配合率上均較前代繼續(xù)下降。但由于其能力上限提升過快,極少數情況下若沿錯誤軌道繼續(xù)執(zhí)行,隱蔽完成額外目標、規(guī)避監(jiān)控的能力也更強。
5.Anthropic:融資與算力合作同步加碼,谷歌(GOOG)與亞馬遜(AMZN)是核心合作伙伴。Anthropic截至2026年4月估值已達3800億美元,ARR超過300億美元。亞馬遜(AMZN)累計投資80億美元,并通過AWS與Trainium深度綁定Anthropic核心訓練;谷歌(GOOG)累計投資30多億美元,自2025年10月份開始合作,2026年4月,Anthropic進一步增加明年TPU的部署量,未來預計達3.5g(885556)W,按照功耗推算,預計達200-300萬顆芯片采購。
6.谷歌(GOOG)TPU:微架構與集群系統(tǒng)雙重迭代,有望持續(xù)受益前沿模型訓練需求擴張。谷歌(GOOG)TPU的核心優(yōu)勢,不只是單芯片性能提升,而是“芯片+互聯(lián)+集群”一體化演進。從TPUv1到TPUv7,谷歌(GOOG)持續(xù)在矩陣計算單元、HBM、ICI互聯(lián)、拓撲結構和集群能力上升級,使TPU從早期推理芯片逐步發(fā)展為可支撐超大模型訓練的完整超級計算平臺。隨著谷歌(GOOG)與頭部AI公司在下一代TPU集群上的合作不斷加深,TPU正在成為前沿模型訓練的重要底座。
風險提示:人工智能(885728)技術發(fā)展不及預期;互聯(lián)網廠商資本開支不及預期;參與廠商眾多導致競爭格局惡化;政策監(jiān)管力度不及預期。
