新智元報道
翻譯:胡祥傑 張易
2017 新智元開源·生態 AI 技術峰會 【倒計時 8 天,點擊「閱讀原文」搶票】 AI 2017 開年盛典啟幕在即,三大亮點不容錯過:① 兩會
聚齊 BAT人工智慧技術領袖,洞察 AI 軍團布局;② 引爆 AI 原力,
現場參與 AI 技術論壇頂牛對撞;③人工智慧創業家巨星璀璨,看投資領袖預測
誰將成為 AI 獨角獸。
【新智元導讀】谷歌最近開源了一個JPEG圖像壓縮編碼器,比同類方法壓縮要小35%。
在互聯網上,速度意味著一切。一個通用的規則是:文件越小,載入的速度會越快。為了在這方面獲得提升,谷歌最近開發了一個開源的JPEG 編碼器,據稱能在不損害圖像質量的前提下有效地縮小文件大小,進而讓網頁的載入變得更快。
新的編碼器名為Guetzli,也就是瑞士德語中的「緩存」(cookie)的意思。根據谷歌官方博客的說法,這一新的工具能夠創造「高質量的JPEG圖像,比當下可用的其他方案壓縮的圖像小35%」。使用Guetzli 的一個好處是,其壓縮后的圖片依然是常規的JPEG 文件,進而能支持現有幾乎所有的瀏覽器和應用程序。
谷歌此前也曾有過多個項目,用戶縮減網頁上的圖片大小,包括Zopfli 編碼器(它能在損害格式的前提下創造更小的PNG 圖像),還有Webp(一種新的圖片格式,支持無損和有損壓縮,以改進文件大小)。
此前,谷歌還發布過一種基於RNN 的圖像壓縮方法,名為RAISR。RAISR 生成圖像的質量比當前超解析度技術更好、時間最高快 100 倍,能夠實時在移動設備上運行,還能消除低解析度圖像中的混疊偽影(aliasing artifacts)。
JPEG的圖像視覺質量和其多級壓縮處理(顏色空間變換、離散餘弦變換及量化)直接相關。Guetzli專門以量化階段作為目標。這一階段中圖像視覺質量損失所大,得到的文件越小。Guetzli在最小損失和文件大小之間找到了一個平衡。它採用了一種搜索演算法,來盡量克服JPEG格式的心理視覺建模與Guetzli的心理視覺模型之間的差異,後者在模擬色彩感知和視覺掩模方面比用簡單的顏色變換和離散餘弦變換來得更全面和詳細。然而,雖然Guetzli創建的圖像較小,但代價是這些搜索演算法創建壓縮圖像的時間比當前其他方法要長得多。
雖然Guetzli可以在不犧牲圖像質量的前提下產生更小的圖像,我們也發現,在實驗中,儘管壓縮圖像文件大小保持不變,比起libjpeg圖像,人類評價者卻始終更喜歡Guetzli生成的圖像,即使libjpeg文件大小相同甚至略大。 我們認為這使花較長時間進行壓縮變成了值得使用的折衷方案。
上圖的例子中,左邊是原圖,最右邊是Guetzli壓縮后的結果。中間是libjpeg的壓縮。
根據谷歌的說法,Guetzli 在壓縮圖片的時間上確實會比其他方法長一些,但是,這些時間都會在載入的過程中補回來,因為載入的時間表短了。另外,谷歌發布的一篇論文發現,用戶使用Guetzli 壓縮的圖片格式的質量比其他類似方法要好很多,甚至比其他一些更大的JPEG文件都要好。
更多的細節,可查看谷歌博客:https://research.googleblog.com/2017/03/announcing-guetzli-new-open-source-jpeg.html?m=1