■原題:「裝備大模型化」落地破圈!AI技術(shù)的一次自證與他證
■記者:三北
大模型已經(jīng)展現(xiàn)出對(duì)智能裝備“點(diǎn)石成金”的功效。
宇視展臺(tái)現(xiàn)場(chǎng)人頭攢動(dòng)
狂飆500多天后,國(guó)內(nèi)的“百模大戰(zhàn)”正進(jìn)入落地驗(yàn)證期。當(dāng)下,行業(yè)和產(chǎn)業(yè)對(duì)大模型的期待,正從“你家大模型有多強(qiáng)?”變?yōu)椤澳愕拇竽P湍軒臀腋墒裁矗俊薄?/SPAN>
10月22日-10月25日,2024中國(guó)國(guó)際社會(huì)公共安全產(chǎn)品博覽會(huì)(簡(jiǎn)稱:2024安博會(huì))在北京舉辦。作為多年來(lái)AI產(chǎn)業(yè)發(fā)展的一大風(fēng)向標(biāo),這場(chǎng)盛會(huì)被產(chǎn)業(yè)人士寄托的使命之一正是回答上述問(wèn)題。而這,也是AIoT頭部企業(yè)宇視科技在做的事。
今年安博會(huì)上,宇視科技的展臺(tái)成為人氣最高展臺(tái)之一。通過(guò)五大展區(qū)近百個(gè)展出單元,宇視亮出了AI大模型落地的實(shí)戰(zhàn)成果和作戰(zhàn)圖譜。
像百度搜索一樣檢索視頻內(nèi)容的“萬(wàn)物搜”、夜視能力倍增的AI-ISP獵光系列夜視攝像機(jī)、能跟用戶互動(dòng)的AI體育鍛煉屏、助智慧城市治理降本增效的大模型方案……今年宇視已不限于大模型相關(guān)部件產(chǎn)品展示,而是實(shí)現(xiàn)從軟件、裝備到行業(yè)方案全覆蓋。
2023年5月,宇視推出AIoT行業(yè)大模型“梧桐”,今年4月升級(jí)為“梧桐2.0”版本,多模態(tài)及推理能力進(jìn)一步升級(jí),目前已經(jīng)衍生和優(yōu)化了上千種相關(guān)AI算法,落地城市、交通、文娛、教育等超十個(gè)行業(yè)。
宇視展臺(tái)現(xiàn)場(chǎng)展出的梧桐2.0架構(gòu)圖
當(dāng)下,AI亟需完成一次新的價(jià)值自證和他證。To C消費(fèi)類AI大模型產(chǎn)品的流量高峰已被瓜分一波,第二波機(jī)會(huì)來(lái)到了與實(shí)體經(jīng)濟(jì)息息相關(guān)的To B數(shù)字化轉(zhuǎn)型市場(chǎng)。
透過(guò)宇視科技本次安博會(huì)的展出,回溯其在數(shù)字化轉(zhuǎn)型中的“探?!敝?,我們可以看到,大模型的底座價(jià)值正如何一步步潛入千行百業(yè),轉(zhuǎn)化為新質(zhì)生產(chǎn)力。
智能升級(jí):基于梧桐2.0的“萬(wàn)物搜”來(lái)了
今年安博會(huì),要說(shuō)最引人關(guān)注的AI大模型新應(yīng)用是什么?
可能不是各家都在做的智能聊天機(jī)器人,也不是爆火的AI視頻生成工具,而是這款名為“萬(wàn)物搜”的視頻搜索“神器”。
在宇視中心區(qū)域展區(qū),一塊大屏幕前,圍滿了視頻數(shù)據(jù)服務(wù)系統(tǒng)“萬(wàn)物搜”的體驗(yàn)者。他們只需要輸入文字描述,就能從現(xiàn)場(chǎng)實(shí)時(shí)視頻內(nèi)容中,快速檢索出貼近意圖的結(jié)果。比如搜索“拉行李箱的人”,“萬(wàn)物搜”就會(huì)立刻識(shí)別并輸出對(duì)應(yīng)的結(jié)果。
“萬(wàn)物搜”被許多觀眾圍觀體驗(yàn)
即便是一些十分小眾的情況,“萬(wàn)物搜”也可以通過(guò)深度解析和語(yǔ)義理解,搜索到用戶所需內(nèi)容。比如搜索“帶狗頭頭套的人”這樣語(yǔ)義更具體的描述,“萬(wàn)物搜”也能準(zhǔn)確地識(shí)別并找到。
“萬(wàn)物搜”現(xiàn)場(chǎng)體驗(yàn)
當(dāng)輸入“一個(gè)舉著手機(jī)拍照的年輕男士”這種多個(gè)任意元素組合的提示詞,“萬(wàn)物搜”也能立刻識(shí)別出來(lái)貼合表述的視頻內(nèi)容。
“萬(wàn)物搜”現(xiàn)場(chǎng)體驗(yàn)
這一應(yīng)用具有很強(qiáng)的應(yīng)用價(jià)值,比如可用于失物招領(lǐng)。在一個(gè)智慧園區(qū)場(chǎng)景,某業(yè)主購(gòu)買了一份麥當(dāng)勞外賣丟失了,他只需要借助“萬(wàn)物搜”去搜索“拿麥當(dāng)勞外賣的人”,就可以查詢到相關(guān)的視頻記錄,從而尋回失物。
宇視相關(guān)負(fù)責(zé)人鄭勇告訴智東西,“萬(wàn)物搜”基于多模態(tài)大模型算法開(kāi)發(fā)。相比于傳統(tǒng)小模型時(shí)代的CV識(shí)別車牌、衣著等部分有限特征,“萬(wàn)物搜”的搜索對(duì)象的邊界得到了極大擴(kuò)展,從而使行業(yè)價(jià)值也得到大幅提升。
究其背后主要的技術(shù)難點(diǎn),還是多模態(tài)融合。
據(jù)悉,“萬(wàn)物搜”基于宇視自研行業(yè)大模型“梧桐2.0”,融合自然語(yǔ)言處理、視頻特征提取和智能識(shí)別多種能力,深度理解分析輸入文本、語(yǔ)音或圖片,及其上下文語(yǔ)境關(guān)系,從而讓用戶可以準(zhǔn)確搜索到所需的大部分視頻內(nèi)容。
“梧桐2.0”是一個(gè)覆蓋了圖像編解碼、計(jì)算機(jī)視覺(jué)、自然語(yǔ)言處理、多模態(tài)等多個(gè)領(lǐng)域的AIoT行業(yè)大模型。根據(jù)宇視官方數(shù)據(jù),其已經(jīng)基于“梧桐2.0”大模型面向十個(gè)行業(yè)推出了近千種長(zhǎng)尾算法。與此同時(shí),其在這十大行業(yè)“梧桐2.0”均已有產(chǎn)品出貨和項(xiàng)目實(shí)際落地。
“從業(yè)者會(huì)有一個(gè)很直觀的感受,越來(lái)越多的長(zhǎng)尾算法的需求都能得到響應(yīng),行業(yè)對(duì)于視頻能力的期待也因大模型提高了。”鄭勇說(shuō)。
可以看到,AI大模型已經(jīng)催生了一大批智能功能和行業(yè)算法,呈現(xiàn)出落地可用的效果。
而這,只是AI價(jià)值自證的一個(gè)開(kāi)始。這些智能功能還需要在城市管理、交通治理、園區(qū)運(yùn)營(yíng)等各行各業(yè)的場(chǎng)景中廣泛應(yīng)用,才能真正發(fā)揮出行業(yè)價(jià)值。
裝備進(jìn)化:把大模型“塞進(jìn)”攝像機(jī)
在大模型進(jìn)入行業(yè)之前,有一個(gè)重要中間環(huán)節(jié)不容忽略,那就是“裝備大模型化”。
當(dāng)下,我們看到微軟正在將大模型“塞進(jìn)”電腦,華為、蘋(píng)果等手機(jī)廠商正將大模型“塞進(jìn)”手機(jī)。而以宇視為代表的AIoT頭部企業(yè),也正將大模型“塞進(jìn)”攝像機(jī)。
大模型正催生新的裝備進(jìn)化——本次,在宇視展臺(tái)上備受關(guān)注的AI-ISP獵光系列智能攝像機(jī)就是一大代表?;诖竽P痛蛟斓摹矮C光2.0-AI-ISP”圖像引擎,可以使得前端攝像機(jī)應(yīng)對(duì)多種極黑、無(wú)光、微光場(chǎng)景挑戰(zhàn)。
在現(xiàn)場(chǎng)設(shè)置的暗室中,一臺(tái)僅僅數(shù)百元的經(jīng)濟(jì)型攝像機(jī),即使是在低至令人難以置信的≤0.0001 Lux的照度環(huán)境下,依然能夠讓圖像呈現(xiàn)出如同在白晝中一般的鮮艷色彩。
AI-ISP獵光系列智能攝像機(jī)效果展示
大模型+智能攝像機(jī)設(shè)備,讓過(guò)去AIoT行業(yè)難以解決的痛點(diǎn)迎刃而解。
眾所周知,夜間是安全隱患的高發(fā)時(shí)段。由于光線不足,人類視覺(jué)難以清晰地觀察到周圍的環(huán)境,往往使得安全隱患難以察覺(jué),星光等夜視攝像機(jī)的出現(xiàn)大大緩解了這一問(wèn)題。但具有高品質(zhì)成像效果的傳統(tǒng)夜視攝像機(jī)成本較高,在方案部署的時(shí)候容易被戰(zhàn)略性舍棄。
缺少高性價(jià)比的夜視攝像機(jī),這是行業(yè)的一大痛點(diǎn)。
宇視AI-ISP獵光系列智能攝像機(jī)直擊這一痛點(diǎn)。鄭勇告訴智東西,基于“梧桐2.0”,攝像機(jī)算法在訓(xùn)練的過(guò)程中,可以采用由AI生成的大量不同場(chǎng)景的視頻素材,例如微光的魚(yú)塘、無(wú)光的鄉(xiāng)村小路等,從而大大壓縮了訓(xùn)練成本。
同時(shí),基于數(shù)千種場(chǎng)景的實(shí)驗(yàn)訓(xùn)練及測(cè)試,AI-ISP獵光系列智能攝像機(jī)算法快速迭代,強(qiáng)化拖影收斂、動(dòng)態(tài)降噪、場(chǎng)景提亮、色彩還原、對(duì)比度增強(qiáng)效果,使圖像質(zhì)量突破傳統(tǒng)ISP極限。
可以看到,大模型已經(jīng)展現(xiàn)出對(duì)裝備“點(diǎn)石成金”的效果。
而這只是“裝備大模型化”眾多例子中的一個(gè)。
今年4月,宇視提出“把所有裝備用大模型重做一遍”的理念,隨即推出了一大批“裝備大模型化”產(chǎn)品,覆蓋了AI端側(cè)裝備、AI邊緣端裝備、AI邊緣域裝備全業(yè)務(wù)場(chǎng)景。
在這三大場(chǎng)景中,除了AI-ISP獵光系列智能攝像機(jī),大模型改造的設(shè)備還涉及AI體測(cè)一體機(jī)、室內(nèi)AI體鍛屏、視頻智能推訓(xùn)一體機(jī)、視頻數(shù)據(jù)服務(wù)一體機(jī)等多種硬件,都實(shí)現(xiàn)了不同程度的數(shù)倍效果提升。
做“裝備大模型化”的難點(diǎn)是什么?
鄭勇告訴智東西,不同于手機(jī)、PC等設(shè)備大模型化,AIoT設(shè)備在屬于相對(duì)弱交互但高專業(yè)度的領(lǐng)域,這就需要在大模型、AIoT及行業(yè)中都有深耕的業(yè)務(wù)團(tuán)隊(duì)來(lái)進(jìn)行支持開(kāi)發(fā),這也成為宇視做這件事的一大優(yōu)勢(shì)。
宇視正通過(guò)軟件硬件化、硬件裝備化、裝備序列化等一系列創(chuàng)新研發(fā),為全行業(yè)帶來(lái)“裝備大模型化”產(chǎn)品底座開(kāi)放能力的質(zhì)變。
當(dāng)下,無(wú)論是面向消費(fèi)者市場(chǎng)還是企業(yè)級(jí)市場(chǎng),裝備大模型化已經(jīng)成為行業(yè)發(fā)展的必然趨勢(shì)。
而從企業(yè)級(jí)數(shù)字化轉(zhuǎn)型市場(chǎng)來(lái)看,我國(guó)ICT裝備門(mén)類眾多、產(chǎn)品強(qiáng)大而豐富。這些裝備更是大模型落地的重要載體,是大模型落地實(shí)體物理世界、釋放千行百業(yè)新質(zhì)生產(chǎn)力的重要抓手。
行業(yè)破圈:AI技術(shù)的一次自證與他證
大模型帶來(lái)了智能功能和裝備的進(jìn)化,最終的效果還要在行業(yè)中驗(yàn)證。
作為一家AIoT產(chǎn)品方案及能力提供商,宇視在視圖領(lǐng)域有著多年的沉淀積累,致力于在智慧城市、交通、電力、企業(yè)園區(qū)等多個(gè)場(chǎng)景領(lǐng)域進(jìn)行視圖價(jià)值賦能。如今這些行業(yè)經(jīng)驗(yàn),也正幫助其大模型加速在行業(yè)落地。
在本次安博會(huì)上,我們可以看到基于“梧桐2.0”的智能功能、裝備已經(jīng)落地到了文體娛樂(lè)、智慧城市、智慧交通、生態(tài)保護(hù)等各個(gè)領(lǐng)域。
以宇視在現(xiàn)場(chǎng)展示的AI體育方案為例,基于梧桐大模型的AI體育鍛煉屏可以讓很多人站在同一個(gè)屏幕前一起做運(yùn)動(dòng),記錄他們的動(dòng)作細(xì)節(jié)和成績(jī),為其自動(dòng)打分并提供鍛煉建議。這不僅可以幫助校園開(kāi)展運(yùn)動(dòng)、教學(xué),也為社區(qū)鍛煉等更多場(chǎng)景提供了可能性。
AI體育解決方案展示
鄭勇透露,自梧桐大模型推出以來(lái),宇視科技發(fā)力文教體領(lǐng)域,推出了AI體鍛屏、AI跑步屏、AI足球、旅拍兔VLOG、VR導(dǎo)游產(chǎn)品等多個(gè)創(chuàng)新解決方案,已快速落地全國(guó)百余個(gè)城市。
在剛剛結(jié)束的“2024吳鉤足球全國(guó)總決賽”中,直播正是由宇視的AI全景相機(jī)進(jìn)行智能導(dǎo)播。在支持多視頻拼接畫(huà)面自動(dòng)矯正消除畫(huà)面畸變的同時(shí),其基于AI畫(huà)面矯正及運(yùn)鏡算法,讓攝像機(jī)進(jìn)行自動(dòng)檢測(cè)控球權(quán)、自動(dòng)運(yùn)鏡跟蹤,從而讓AI像人一樣去進(jìn)行精彩賽事直播。
基于宇視“梧桐2.0”打造的解決方案,也同時(shí)落地到了智慧城市治理、智慧人行、智慧車行、動(dòng)物保護(hù)等各個(gè)領(lǐng)域。
在某地的智慧城市治理中,相關(guān)部門(mén)應(yīng)用了基于“梧桐2.0”的城市解決方案,聚焦群眾關(guān)注的民生問(wèn)題比如廣場(chǎng)舞噪音管理、社區(qū)及城市的衛(wèi)生管理等問(wèn)題,使其得到高效解決,12345投訴量下降60%。
在這類場(chǎng)景中,各種細(xì)碎的問(wèn)題都可以找到個(gè)性化長(zhǎng)尾算法,比如:噪音傳感器加視頻聯(lián)動(dòng),解決工地超時(shí)施工擾民難題;物聯(lián)網(wǎng)油箱蓋加車載攝像機(jī),解決危險(xiǎn)駕駛隱患和油耗異常等。這些行業(yè)解決方案,都不同程度地助力提升管理效率,減少安全隱患。
大模型為各個(gè)行業(yè)的數(shù)字化轉(zhuǎn)型帶來(lái)了真實(shí)價(jià)值,也為各個(gè)行業(yè)的從業(yè)者帶來(lái)更多機(jī)會(huì)和商機(jī)。
這不僅是宇視AI技術(shù)的一次自證,也是其與集成商、渠道商伙伴開(kāi)啟的一次他證。
在去年6月的北京安博會(huì)現(xiàn)場(chǎng),宇視啟動(dòng)了梧桐大模型種子合作伙伴計(jì)劃,與來(lái)自交通、教育、零售、體育公共服務(wù)等領(lǐng)域的多位伙伴合作開(kāi)啟共創(chuàng)。
宇視提供軟件技術(shù)賦能平臺(tái),推出了集數(shù)據(jù)管理、模型管理、服務(wù)管理、快捷工具于一體的行業(yè)大模型生態(tài)服務(wù)平臺(tái);行業(yè)伙伴基于宇視平臺(tái)和協(xié)助,進(jìn)行解決方案的開(kāi)發(fā)和推廣。
時(shí)隔一年多,鄭勇告訴智東西,一些合作比較深入的伙伴已經(jīng)能夠收益。他們通過(guò)宇視推訓(xùn)一體機(jī)去訓(xùn)練行業(yè)自有模型,將產(chǎn)品和方案銷售給同行或終端用戶,還能進(jìn)行二次收益。
可以看到,當(dāng)集成商、渠道商從“搬箱子”的人變?yōu)橹悄芑桨缸稍兎?wù)商,與上游設(shè)備商的關(guān)系由買賣變?yōu)榕嘤凸矂?chuàng)關(guān)系,AI技術(shù)的自證與他證也正在接近完成時(shí)。
生態(tài)賦能是一個(gè)長(zhǎng)期過(guò)程。當(dāng)下,仍然有一些生態(tài)伙伴抱有慣性思維,希望買回一臺(tái)機(jī)器就擁有了大模型能力,因此在初始階段存在開(kāi)發(fā)上手難的問(wèn)題。對(duì)此,宇視會(huì)直接跟進(jìn)和協(xié)助伙伴項(xiàng)目,保障項(xiàng)目看到效果;同時(shí)打磨設(shè)備,以開(kāi)發(fā)出讓伙伴更易上手的平臺(tái)工具。
可以預(yù)測(cè),AI大模型帶來(lái)的將是整個(gè)行業(yè)數(shù)字化生態(tài)的變革。AIoT硬件市場(chǎng)或許會(huì)進(jìn)一步向頭部集中,但算法、軟件、解決方案的能力將更多向集成商、渠道商靠近,從而形成新的行業(yè)秩序。
結(jié)語(yǔ):宇視之路,AIoT行業(yè)之變
當(dāng)全球大模型技術(shù)產(chǎn)業(yè)競(jìng)賽加劇,中國(guó)企業(yè)與大模型技術(shù),正以更快的速度和千行百業(yè)搭起橋梁,落地見(jiàn)效。宇視科技圍繞“裝備大模型化”的探索之路,也正印證了中國(guó)AIoT行業(yè)之變。
獨(dú)行快,眾行遠(yuǎn)。裝備大模型化及產(chǎn)業(yè)落地前景遠(yuǎn)大,但道阻且長(zhǎng),這是一條必須有伙伴同行的路。我們看到,產(chǎn)業(yè)鏈上的不少玩家已經(jīng)在轉(zhuǎn)換角色和思路,融入全新的生態(tài)共融秩序。AI技術(shù)的自證與他證仍在進(jìn)行中,宇視和他的伙伴們將一起合力推動(dòng)新業(yè)態(tài)的形成。
[出處]「裝備大模型化」落地破圈!AI技術(shù)的一次自證與他證. 智東西, 2024-10-22