2026年 1 月 8 日,阿里通義大模型正式發(fā)布并開源 Qwen3-VL-Embedding 與 Qwen3-VL-Reranker 模型系列。這兩款基于 Qwen3-VL 構(gòu)建的新模型,專為多模態(tài)信息檢索與跨模態(tài)理解設(shè)計,為圖文、視頻等混合內(nèi)容的處理提供了統(tǒng)一高效的解決方案,標志著多模態(tài)檢索技術(shù)在開源領(lǐng)域?qū)崿F(xiàn)重要突破。
此次發(fā)布的雙模型系列具備強大的多模態(tài)通用性,可在統(tǒng)一框架內(nèi)處理文本、圖像、可視化文檔(含圖表、代碼、UI 組件等)及視頻等多種輸入類型。在圖文檢索、視頻 - 文本匹配、視覺問答、多模態(tài)內(nèi)容聚類等核心任務中,模型性能達到業(yè)界領(lǐng)先水平,展現(xiàn)出廣泛的應用適配能力。
技術(shù)架構(gòu)上,兩款模型各司其職又協(xié)同增效。Qwen3-VL-Embedding 采用雙塔架構(gòu),能將視覺與文本信息映射到同一語義空間,生成語義豐富的向量表示,實現(xiàn)高效跨模態(tài)相似度計算與快速召回。Qwen3-VL-Reranker 則以單塔交叉注意力架構(gòu)為核心,接收任意模態(tài)組合的查詢與文檔對,輸出精確相關(guān)性分數(shù),完成精細化重排序。這種 "Embedding 召回 + Reranker 重排" 的兩階段檢索流程,大幅提升了檢索結(jié)果的精準度。
在權(quán)威基準測試中,該系列模型表現(xiàn)亮眼。Qwen3-VL-Embedding-8B 在 MMEB-v2 評測中超越所有此前的開源模型和閉源商業(yè)服務;Reranker 模型各版本性能均優(yōu)于基礎(chǔ) Embedding 模型及基線 Reranker,8B 版本在多數(shù)任務中表現(xiàn)最佳。同時,模型繼承了 Qwen3-VL 的多語言能力,支持超過 30 種語言,且提供靈活的向量維度選擇與任務指令定制,量化后仍保持優(yōu)秀性能,便于開發(fā)者快速集成。
當前,多模態(tài) AI 市場正高速增長,據(jù)前瞻產(chǎn)業(yè)研究院數(shù)據(jù),2030 年中國多模態(tài)大模型市場規(guī)模預計將突破 969 億元。Qwen3-VL 雙模型的開源,不僅為開發(fā)者提供了高性能的技術(shù)工具,更將推動多模態(tài)檢索在電商導購、智能教育、工業(yè)質(zhì)檢、內(nèi)容審核等場景的規(guī)模化應用。
開發(fā)者可通過 GitHub 倉庫(https://github.com/QwenLM/Qwen3-VL-Embedding)或魔搭 ModelScope 平臺獲取模型,快速部署至現(xiàn)有系統(tǒng)。這一系列模型的開源,將進一步降低多模態(tài)技術(shù)的應用門檻,加速跨模態(tài)理解與檢索技術(shù)的產(chǎn)業(yè)落地。
網(wǎng)站首頁 | 公司簡介 | 加入我們 | 聯(lián)系我們 | 虛擬主機 | 無錫網(wǎng)頁設(shè)計 | 域名注冊
無錫企業(yè)做網(wǎng)站模版 | 無錫做網(wǎng)站 | 無錫企業(yè)網(wǎng)站建設(shè)|先舟erp| 無錫不銹鋼加工廠|軟瓷
版權(quán)所有:無錫世融網(wǎng)絡科技有限公司 Copyright?2010 蘇ICP備10231109號-3 ICP電信經(jīng)營許可證:蘇B2-20100211