在2015 年Waifu 2x 項目的出現可以說是為阿宅們在放大圖片方面開啟了一個新的時代,基於深度卷積神經網絡理論開發的Waifu 2x 在放到ACG 圖片方面有奇效,而且還被應用在一些視頻壓制軟件的插件中。最近又有一個基於Waifu 2x 技術進行優化的圖片放大網站Bigjpg,這篇文章就是簡單介紹Waifu 2x 技術與Bigjpg 這個網站。

首先說明Waifu 2x 項目的開發是從香港中文大學的研究團隊的SRCNN理論中得到靈感,所謂SRCNN 是Super-Resolution Convolutional Neural Network 的縮寫,也就是超分辨卷積神經網絡後來又推出了FSRCNN 理論(提升SRCNN 處理速度)。Waifu 2x 技術的大致框架是SRCNN。與其說Waifu 2x 是個ACG 圖片降噪拉伸技術,準確來說Waifu 2x 是基於深度卷積神經網絡的圖片還原拉伸技術。比如JPEG 這種圖像處理標準本身是非可逆壓縮,一旦壓縮一次肯定是無法還原至最原始的狀態。

放大後的照片會顯得比較奇怪

而Waifu 2x 其實是通過卷積神經網絡去學習大量的圖片,將還原的圖片進行自我理解,按照自己的理解還原圖片。比如當我很想搞事的使用Waifu 2x 放大茅野愛衣那張戴戒指的小圖的時候,就會發現即便在Bigjpg 上選擇照片模式,降噪開到最大,但生成的放大照片就像是都美顏過一樣。

Waifu 2x 放大漫畫網點

而另一個極端案例就是漫畫常見的網點,如果用Waifu 2x 放大漫畫網點,就會發現放大後的圖片是Waifu 2x 自己補足的網點,和真正的漫畫網點圖並非一致。而神奇的是當將放大的圖片縮小為0.5 倍後與原始網點圖片又並無二致。儘管Waifu 2x 被認為是神器,但技術也是有其自身極限的,分辨率過小的圖片以及壓縮過度失真的照片,Waifu 2x 也是無能為力的。比如100 × 100 的表情包即便參數怎麼調整,Waifu 2x 放大出來的也不會是一張高清表情圖。

這次要談的Bigjpg 網站所使用的技術之前已經提到是基於Waifu 2x 技術優化,實際上從2015 年Waifu 2x 這個技術出現後,相關的Waifu 2x 在線圖片放大網站,還有本地軟件已經有一些。Bigjpg 對於國內用戶來說更加友好一些,比如支持最高放大16 倍,素材圖片最大分辨率與文件小大限制在3000 × 3000 與10 M 以內。註冊用戶還可以實現離線處理圖片,保留圖片處理歷史等功能,就ACG 類圖片處理來說 Bigjpg 絕對滿足日常使用需求。

原始尺寸

放大2 倍後的效果

今天我特別試了下人類照片在該網站的放大,比如杉田智和的這張照片原始分辨率是400 × 266。在選擇照片處理模式,高降噪的情況下,2 倍放大的效果(800 × 532)要比4 倍放大(1600 × 1064)好很多。

640 ×558 尺寸原始圖

左邊Waifu 2x 放大2 倍,右邊Waifu 2x 放大4 倍

左邊官圖2974 × 2115 版本與右邊Waifu 2x 放大4 倍版本對比

在動畫圖片方面,我使用《寶石之國》的官圖,小圖是640 ×558 尺寸,分別使用Bigjpg 網站放大2 倍、4 倍(均為高降噪),每張放大圖片處理時間30 秒內,總體來說還是放大2 倍的效果最好,放大4 倍的話,之前提到Waifu 2x 實際上是機器自動腦補出圖片的細節內容之後放大,與官圖的大圖版對比就會發現明顯的區別。像中等分辨率與比較小的分辨率圖片2 倍放大的效果是最好的,再進一步方法圖片就很彆扭了。而本身就是高分辨率的圖片在Bigjpg 可以進行再度放大來符合4K 屏幕標準。比如將 2974 × 2115 版本的寶石之國官圖放大4 倍得出的效果,就非常好。

2974 × 2115 版本官圖通過Bigjpg 放大四倍後的版本(新浪上有壓縮)

https://ws1.sinaimg.cn/large/d63ab74bly1flncqu9h6fj23qx2nyhdy.jpg

https://pan.baidu.com/s/1miuwkbQ