本報(bào)訊 (記者李喬宇)5月8日,商湯集團(tuán)股份有限公司(以下簡(jiǎn)稱(chēng)“商湯”)正式推出新一代輕量化多模態(tài)智能體模型——商湯日日新SenseNova 6.7 Flash-lite(LITE),全線辦公技能SenseNova-Skills同步在GitHub開(kāi)源。
傳統(tǒng)智能體模型采用“語(yǔ)言+視覺(jué)”拼接設(shè)計(jì),通常將視覺(jué)只作為文本的補(bǔ)充,無(wú)法深度參與核心決策與推理循環(huán)。這導(dǎo)致信息在“轉(zhuǎn)譯”過(guò)程中受損,且伴隨著高昂的詞元(Token)消耗。
SenseNova 6.7 Flash-lite(LITE)徹底改變了這一鏈路,它專(zhuān)為“真實(shí)世界工作流”而生,采用原生多模態(tài)架構(gòu),能夠像人類(lèi)一樣,能直接“看懂”復(fù)雜的網(wǎng)頁(yè)布局、文檔結(jié)構(gòu)與財(cái)務(wù)圖表,實(shí)現(xiàn)“看、想、做”一體化,可大幅提升數(shù)據(jù)分析、深度調(diào)研、PPT生成等長(zhǎng)鏈路復(fù)雜任務(wù)的成功率。
同時(shí)在取消了視覺(jué)轉(zhuǎn)文本中間層后,它能以更小的參數(shù)量,實(shí)現(xiàn)智能體能力的跨越式提升,在權(quán)威智能體基準(zhǔn)測(cè)試中取得同級(jí)別多項(xiàng)SOTA。它還可大幅降低推理過(guò)程中的詞元(Token)消耗,在信息搜索等場(chǎng)景中詞元(Token)消耗對(duì)比純文本智能體直降60%。并可實(shí)現(xiàn)毫秒級(jí)反饋,更符合高頻互動(dòng)的生產(chǎn)環(huán)境需求。
據(jù)悉,SenseNova 6.7 Flash-lite(LITE)已支持金融、制造、醫(yī)療、教育等全行業(yè)核心工作流。
