日常生活中,每個類別的垃圾往往包含了各式各樣的內容,僅憑經驗,人們在分類投放的時候難免會出現偏差。幸運的是,得益于云計算、大數據、人工智能和物聯網等先進計算技術的發展,垃圾分類識別變得精準高效起來。
通過先進計算技術,垃圾分類識別是否能做到非常精準?速度快不快?技術多久可以成熟并普及開來?帶著如上一系列問題,我們采訪了曙光公司大數據智能研究院院長宋懷明博士。
據宋懷明介紹,在計算機大數據視覺分析領域,目前主要基于神經網絡的算法進行圖像分類,分類技術有很多種。具體到垃圾分類,有單一目標分類,即對整張圖片進行分類,為圖片給出唯一的分類標簽,如單個瓶子的照片——可回收,果核照片——濕垃圾;有多目標檢測分類,是對圖片中的多種垃圾進行定位及單獨分類,比如一堆垃圾中,瓶子是可回收,廢紙則是干垃圾。前者,技術相對容易實現,市場上近期比較熱門的幾個手機垃圾分類的APP都是使用這種技術;后者則在生活中更為實用,應用場景更為廣泛,但研發難度也更大。

使用曙光慧眼系統進行垃圾分類模擬實驗
現階段,垃圾分類識別技術的計算產品、算法都較為成熟,難點在缺乏足夠量的訓練圖片集。由于神經網絡算法是一種數據驅動的方法,對訓練樣本數據量及質量要求較高,數據量越大,識別判斷越精準。宋懷明介紹,理想狀態是每一類垃圾數據集為幾萬張圖片,精準度可達到95%以上。如果圖片集數量不足,精準度則會打折扣,這時候曙光的做法是用圖像增強技術增加訓練數據的量級,以提高識別精準度。
至于識別圖片速度,既取決于終端網絡延遲,更取決于后端的處理速度及算法復雜度。以“曙光慧眼”舉例,即使在光線陰暗、適量遮擋、物品一定程度變形變色等條件下,仍可實現毫秒級快速物品識別。
其實曙光慧眼的主要用途并非垃圾分類,而是智能視頻人臉識別,可用于會議簽到、刷臉支付、酒店入住、各類門禁等場景,廣泛應用于會場、車站、機場、學校、地鐵、小區、超市、賓館、企業前臺等復雜場景。
對于成熟的垃圾分類識別技術多久能普及開來,宋懷明表示很樂觀,46個城市,幾億人的剛需,市場空間和商業潛力巨大。即使是復雜的多種垃圾定位分類應用,預計半年內也會成熟并普及使用。