商業(yè)
典型案例公開:網(wǎng)信辦清朗?優(yōu)化營(yíng)商網(wǎng)絡(luò)環(huán)境,整治涉企網(wǎng)絡(luò)黑嘴
國(guó)家網(wǎng)信辦曝光‘清朗?優(yōu)化營(yíng)商網(wǎng)絡(luò)環(huán)境’專項(xiàng)行動(dòng)典型案例,依法關(guān)閉一批涉企網(wǎng)絡(luò)‘黑嘴’賬號(hào)。
楊亮
4小時(shí)前
阿里通義千問團(tuán)隊(duì)于12月25日宣布推出開源視覺推理模型QVQ-72B-Preview,該模型基于Qwen2-VL-72B構(gòu)建,旨在增強(qiáng)視覺推理能力。QVQ-72B-Preview在多個(gè)數(shù)據(jù)集上進(jìn)行了評(píng)估,包括MMMU、MathVista、MathVision和OlympiadBench。
在MMMU基準(zhǔn)測(cè)試中,QVQ-72B-Preview取得了70.3的分?jǐn)?shù),顯著超越了Qwen2-VL-72B-Instruct。此外,在MathVista、MathVision和OlympiadBench等專注于數(shù)學(xué)和科學(xué)問題的基準(zhǔn)測(cè)試中,該模型也表現(xiàn)出色,有效縮小了與領(lǐng)先的最先進(jìn)的o1模型之間的差距。
盡管QVQ-72B-Preview在視覺推理方面表現(xiàn)優(yōu)異,但團(tuán)隊(duì)也指出了該模型的一些限制,包括語言混合與切換、遞歸推理、安全和倫理考慮以及性能和基準(zhǔn)限制。用戶在部署時(shí)應(yīng)保持謹(jǐn)慎,并注意這些潛在問題。
阿里通義千問團(tuán)隊(duì)表示,QVQ-72B-Preview是一個(gè)實(shí)驗(yàn)性研究模型,專注于增強(qiáng)視覺推理能力,未來將繼續(xù)優(yōu)化和改進(jìn)該模型,以提升其在復(fù)雜問題上的表現(xiàn)。