近年來,各個業(yè)務(wù)領(lǐng)域?qū)σ曨l數(shù)據(jù)的AI分析的需求急劇增加。尤其是第五代移動通信系統(tǒng)的普及,預(yù)計將導(dǎo)致攝像機捕獲的超高清視頻圖像以及街頭和生產(chǎn)線上捕獲的許多圖像爆炸性增長。
在開發(fā)這項新的壓縮技術(shù)時,富士通專注于AI和人類識別圖像的方式上的重要差異。即,在識別視頻數(shù)據(jù)中的人,動物或物體時,人工智能和人類在圖像區(qū)域上往往有所不同,而圖像區(qū)域在強調(diào)判斷時很重要。富士通已開發(fā)出一種技術(shù),可以自動分析AI重視的領(lǐng)域,并將數(shù)據(jù)壓縮到AI可以識別的最小大小。這使得可以分析大量視頻數(shù)據(jù)而不會損害識別精度,同時可以大大降低操作和數(shù)據(jù)傳輸成本。還可以預(yù)期,該技術(shù)將允許用戶通過組合存儲在云中的多個視頻數(shù)據(jù),傳感器數(shù)據(jù)和性能數(shù)據(jù)(例如銷售數(shù)據(jù))來分析更高級的視頻數(shù)據(jù)。
背景與挑戰(zhàn)
近年來,使用AI分析圖像的技術(shù)發(fā)展迅速,并有望成為許多行業(yè)中許多公司進行數(shù)字化轉(zhuǎn)型的驅(qū)動力之一。隨著2020年復(fù)雜的5G移動服務(wù)的到來,對AI分析的需求預(yù)計會進一步增加,同時超高清4K和8K攝像機以及大量視頻數(shù)據(jù)在包括行為分析在內(nèi)的應(yīng)用中的使用也將增加。制造業(yè)和零售業(yè)。
盡管如此,對于用于圖像分析的深度學(xué)習(xí)技術(shù)的處理要求仍提出了相當(dāng)大的挑戰(zhàn)。一種確保處理這些任務(wù)的計算能力的有效技術(shù)是與云一起處理,但是由于視頻數(shù)據(jù)通常非常占用資源,因此需要一種可以將所有視頻數(shù)據(jù)傳輸?shù)皆频母邏嚎s技術(shù)。而不會影響質(zhì)量,從而不會使網(wǎng)絡(luò)帶寬過載。
壓縮視頻會根據(jù)壓縮率降低圖像質(zhì)量,并且如果AI聚焦的區(qū)域過度壓縮,識別精度會降低。富士通開發(fā)了一種視頻壓縮技術(shù),該技術(shù)可以自動分析一幀視頻數(shù)據(jù)圖像中被AI識別為判斷材料的物體的區(qū)域,以每個區(qū)域識別所需的最低圖像質(zhì)量對圖像進行壓縮(2)(圖1)。與傳統(tǒng)的壓縮技術(shù)相比,通過應(yīng)用此技術(shù),可以顯著減小視頻數(shù)據(jù)的大小,同時保持識別精度。
自動估算壓縮比而不影響AI識別精度的技術(shù)。針對每個區(qū)域分析了壓縮特有的圖像質(zhì)量下降對識別精度的影響。根據(jù)AI識別結(jié)果自動估算不影響識別精度的壓縮比。
當(dāng)改變整個圖像的壓縮比并改變圖像質(zhì)量時,通過匯總對識別結(jié)果的影響來確定所有區(qū)域中AI在識別過程中特征的重要程度。將緊接在每個區(qū)域中的識別精度迅速惡化之前的壓縮率估計為不影響識別精度的壓縮率。