一年一度的CVPR 視覺盛宴在西雅圖召開,CVPR是國際上視覺的第一大會(huì)議。2020年是一個(gè)特殊的年份,CVPR 也歷史性的轉(zhuǎn)到ZOOM 視頻會(huì)議上。為了促進(jìn)深度學(xué)習(xí)在視頻壓縮行業(yè)的發(fā)展,由google ,Netflix等巨頭聯(lián)合舉辦的CLIC(CHALLENGE ON LEARNED IMAGE COMPRESSION)已經(jīng)舉辦到了第三屆。
繼2018年圖鴨科技clic獲得圖片壓縮兩項(xiàng)世界冠軍,2019年包攬圖片壓縮4項(xiàng)世界冠軍,在2020年的cvpr大賽上,圖鴨科技登頂視頻壓縮的桂冠,力壓阿里達(dá)摩院,拿下了視頻壓縮的世界冠軍。
深度學(xué)習(xí)視頻壓縮發(fā)展已經(jīng)有5年左右,在過去幾年的時(shí)間里,深度學(xué)習(xí)在圖片壓縮上有很大的突破,但是在視頻壓縮上進(jìn)展一直不是很理想。無論是從速度上還是壓縮性能上,都無法和傳統(tǒng)的h.266競爭。從今年的比賽結(jié)果看,圖鴨科技的性能已經(jīng)超越了傳統(tǒng)的h.266,比起阿里巴巴使用的傳統(tǒng)方法,具有更快的解碼速度。在今年的比賽中,也加入了對模型大小的考量,在深度學(xué)習(xí)弱勢的模型大小下,圖鴨科技摘文件大小比阿里巴巴小的情況下,依然在指標(biāo)上超越了阿里巴巴為代表的h.266傳統(tǒng)模式。從2020年開始,深度學(xué)習(xí)視頻壓縮真正的開始走向成熟。在編碼效率上,深度學(xué)習(xí)壓縮和解碼效率相當(dāng),甚至更快,這是傳統(tǒng)方法無法想象的。
目前圖鴨科技的深度學(xué)習(xí)壓縮的在單張2080ti 顯卡上,已經(jīng)可以實(shí)現(xiàn)3840*2160 @26fps的壓縮,真正的開始走向商用。由于編碼效率和解碼效率相當(dāng),對于大量的非結(jié)構(gòu)化數(shù)據(jù)(圖片和視頻)的存儲和傳輸帶來了巨大的好處。
隨著安防行業(yè)的發(fā)展,中國每年鋪設(shè)的攝像頭數(shù)據(jù)達(dá)到2億個(gè)以上,每個(gè)攝像頭視頻的存儲時(shí)長已經(jīng)由30天提升到90天,單個(gè)攝像頭的存儲成本也達(dá)到了2000元,這對數(shù)據(jù)的存儲的壓力是超級大的,深度學(xué)習(xí)壓縮的出現(xiàn)可以解決大量視頻的存儲問題。隨著智慧城市的發(fā)展,每個(gè)城市每天產(chǎn)生幾十億張高清的照片,無數(shù)的攝像頭拍攝了大量的照片,對圖像存儲的壓力也很大。一個(gè)5000個(gè)攝像頭的抓拍系統(tǒng),存儲成本高達(dá)800萬元。使用圖鴨科技的技術(shù)可以節(jié)約600萬元的成本。
4K+5G的發(fā)展成為了社會(huì)發(fā)展的動(dòng)力,隨著5G的發(fā)展,數(shù)據(jù)量爆炸,5G解決了數(shù)據(jù)傳輸?shù)淖詈笠还飭栴},但是,在公共網(wǎng)絡(luò)上,光纖網(wǎng)絡(luò)的升級是緩慢的,成本因?yàn)?G的到來而逐步升高。利用圖鴨的技術(shù),可以解決公共網(wǎng)絡(luò)傳輸?shù)膸拞栴}。一個(gè)4K電視升級,存儲和帶寬花費(fèi)1500萬元,一路4K視頻的讀寫速度已經(jīng)接近硬盤的讀寫速度上限,數(shù)據(jù)太大,已經(jīng)成為了生產(chǎn)4K內(nèi)容的巨大負(fù)擔(dān),圖鴨的技術(shù)可以解決4K的讀寫問題。
新冠病毒的發(fā)展,使得每個(gè)人都在家辦工,視頻會(huì)議,視頻教育,短視頻都產(chǎn)生了大量的數(shù)據(jù),給網(wǎng)絡(luò)和存儲帶來了巨大的壓力,數(shù)據(jù)量隨著新冠的發(fā)展而爆炸。圖鴨科技的技術(shù)可以解決視頻會(huì)議,視頻教育的流量和存儲問題,節(jié)約70%的成本。
3840*2160 @25fps GPU 和cpu 使用率
一個(gè)新的時(shí)代已經(jīng)到來,深度學(xué)習(xí)結(jié)束了傳統(tǒng)的266每年提升3%壓縮的率的節(jié)奏,壓縮率每年以20%-40%以上在提升,今年正式超越了h.266,也意味著拐點(diǎn)的到來。整個(gè)行業(yè)的洗牌也從2020年開始。