安防行業(yè)作為應(yīng)用AI和多模態(tài)大模型的先鋒領(lǐng)域古劲,展示出其在發(fā)展新質(zhì)生產(chǎn)力方面的強(qiáng)大產(chǎn)業(yè)基礎(chǔ)和能力:
從業(yè)人員眾多、生態(tài)完整:安防產(chǎn)業(yè)鏈條長缰猴,從硬件制造产艾、軟件開發(fā)到系統(tǒng)集成、服務(wù)運(yùn)營滑绒,形成了一個完整的產(chǎn)業(yè)生態(tài)闷堡。這種完整的生態(tài)系統(tǒng)促進(jìn)了技術(shù)知識和行業(yè)經(jīng)驗(yàn)的累積與傳承,加速了新技術(shù)的研發(fā)和推廣疑故。
加速AI落地應(yīng)用杠览,安防是核心應(yīng)用場景
安防行業(yè)是人工智能、物聯(lián)網(wǎng)昵乾、大數(shù)據(jù)等先進(jìn)技術(shù)最早得到應(yīng)用和驗(yàn)證的領(lǐng)域之一牺缰。這些技術(shù)的融合應(yīng)用不僅極大地提升了安防產(chǎn)品和服務(wù)的性能,也推動了行業(yè)自身的升級和變革歼取。
應(yīng)用場景眾多:眼見為實(shí)邦叶,安防因?yàn)槠鋽?shù)據(jù)的豐富性,在計算機(jī)視覺(CV)技術(shù)的驅(qū)動下绅厘,智能安防已經(jīng)跳出傳統(tǒng)技防的范疇尺笼,從安全防控走向安全生產(chǎn),走向基于數(shù)據(jù)和算力驅(qū)動的智慧運(yùn)營缤纽,躍升至為城市管理林下、商業(yè)決策等提供智能數(shù)據(jù)服務(wù)的新階段。
聚焦“AI+安防”融合創(chuàng)新讨绝,依圖科技推出天問大模型
而依圖科技多年來一直專注于人工智能技術(shù)在安防領(lǐng)域的實(shí)踐和應(yīng)用腋芜,早在2019年便開始研究以Transformer為基礎(chǔ)的大模型發(fā)展和應(yīng)用再副,并將圖像感知、視頻感知與大模型結(jié)合花炭,在2023年底發(fā)布了可對話躬拢、會思考、能進(jìn)化的“天問”多模態(tài)大模型见间,在公共安全聊闯、智慧城市、智慧交通米诉、內(nèi)容審核菱蔬、智慧園區(qū)等多個領(lǐng)域?qū)嵺`,推動關(guān)鍵技術(shù)轉(zhuǎn)化為真正的生產(chǎn)力史侣。
由依圖科技創(chuàng)新打造的“天問”多模態(tài)大模型拴泌,已在全國幾十個項(xiàng)目中實(shí)戰(zhàn)部署,在視頻語義搜索惊橱、萬物識別蚪腐、AI智能體編排以及算法零樣本冷啟動等方面展現(xiàn)出巨大潛力。具體場景中税朴,公共安全回季、智慧城市建設(shè)、智慧交通掉房、內(nèi)容審核和智慧園區(qū)等方向的應(yīng)用進(jìn)展顯著茧跋,這些領(lǐng)域?qū)σ曨l分析、行為識別和實(shí)時反應(yīng)的需求不斷增長蟋扩。
天問大模型3大特性捉肄,破解傳統(tǒng)安防技術(shù)應(yīng)用難題
安防從高清走向智能,這是AI安防1.0南翻,人臉識別常苍、人體ReID、視頻結(jié)構(gòu)化绵布、車輛/非機(jī)動車結(jié)構(gòu)化就是這個時期的作品鸵丸。但是一旦安防的應(yīng)用進(jìn)入安全生產(chǎn)就會面臨長尾算法的需求。而傳統(tǒng)深度學(xué)習(xí)模型基于是監(jiān)督學(xué)習(xí)方法訓(xùn)練出來的肪禾,在面臨到這個復(fù)雜場景的時候就會有很多約束和限制贪焊,這就導(dǎo)致過去這七八年AI安防雖然有些進(jìn)展、但是落地的并不好袁羔。大模型時代下進(jìn)入AI 2.0惦肴,基于Transformer架構(gòu),依圖天問多模態(tài)大模型徹底顛覆了傳統(tǒng)安防行業(yè)的碎片化特點(diǎn),會呈現(xiàn)3個特性:
1耳标、會思考
多模態(tài)大模型不再像過去一樣只是某種算法醇坝、某種工具,而是呈現(xiàn)出助手次坡、智能體的特征呼猪,讓機(jī)器看一遍視頻,它能夠準(zhǔn)確識別視頻中的內(nèi)容砸琅,將機(jī)器看視頻的能力轉(zhuǎn)化為直觀的算法宋距,為安防行業(yè)帶來了革命性的變革。
2明棍、可對話
人使用多模態(tài)大模型的過程更像與另外一個人交流乡革。用戶可以通過語義搜索和語音指令調(diào)取視頻寇僧,例如摊腋,僅需簡單地說出“請調(diào)取有積水的點(diǎn)位視頻”,系統(tǒng)便能迅速響應(yīng)嘁傀,展現(xiàn)所有相關(guān)的視頻片段兴蒸。這一功能極大地提升了指揮調(diào)度的效率,節(jié)省了寶貴的決策和調(diào)度時間细办。
3间歌、能進(jìn)化
能進(jìn)化是依圖天問大模型的另一大亮點(diǎn)。不能根據(jù)用戶和環(huán)境而進(jìn)化的智能系統(tǒng)是工具认施,不是真智能鹅址。依圖天問大模型支持現(xiàn)場算法訓(xùn)練,能夠根據(jù)實(shí)際應(yīng)用需求快速迭代和優(yōu)化多蜕。一個新的算法需求可以在1分鐘內(nèi)實(shí)現(xiàn)0樣本冷啟動妨谦,1小時內(nèi)完成在線標(biāo)注訓(xùn)練,并在1天內(nèi)快速上線嘀回,展現(xiàn)了前所未有的智能化和靈活性显而。
算法準(zhǔn)確率90%+,天問大模型實(shí)戰(zhàn)效果優(yōu)異
2023年下半年西部某省份曾經(jīng)出現(xiàn)過烈性犬傷人事件蜜裸,如何快速生成烈性犬檢測算法楷芝、快速布控到城市公共區(qū)域,成為城運(yùn)中心工作人員的難題沧气。如果采用常規(guī)深度學(xué)習(xí)的算法訓(xùn)練方法裕砖,要求數(shù)據(jù)搜集、標(biāo)注牍懂、訓(xùn)練鸵隧,一個新算法的產(chǎn)生至少要半個月后,管理的時效性就沒有了财破。
而基于多模態(tài)大模型的算法訓(xùn)練就簡單的多掰派,預(yù)訓(xùn)練的大模型基座帶來近70%的準(zhǔn)確性从诲,工作人員在預(yù)警處置的過程中簡單點(diǎn)擊預(yù)警的對錯,不到5天的時間就可以完成超過90%的算法準(zhǔn)確率∶蚁郏現(xiàn)場生產(chǎn)新算法方面展現(xiàn)了驚人的速度和靈活性系洛,有效保障了公共安全。這種以用戶需求為核心略步,以技術(shù)創(chuàng)新為驅(qū)動的策略描扯,是推動AI 2.0發(fā)展的關(guān)鍵動力。預(yù)計未來智能安防的大模型將在更多細(xì)分市場和復(fù)雜場景中發(fā)揮關(guān)鍵作用趟薄,特別是在需要高度個性化和動態(tài)適應(yīng)性的場景中绽诚,大模型的應(yīng)用將更具潛力。
依圖科技多模態(tài)大模型的推出杭煎,使視覺和語言的模型歸一恩够,統(tǒng)一了物理世界和認(rèn)知世界的底層框架,讓多模態(tài)的信息之間可以無差別表示和無縫轉(zhuǎn)換枝徙,為大模型的人機(jī)交互模式檬撒、產(chǎn)品迭代模式、服務(wù)運(yùn)營模式都提供了更多的可能性饺焕。AI 2.0走向安全生產(chǎn)促军,走向基于數(shù)據(jù)和算力驅(qū)動的智慧運(yùn)營,這無疑是未來安防行業(yè)發(fā)展的方向什氮。