讓監管水平與互聯網技術一起迭代升級
浙江建設“全國互聯網廣告監測中心平臺”取得階段性成果
本報訊 (徐 峰 張 律 記者曹吉根)近日從浙江省民營經濟發展中心獲悉,截至5月25日,該中心建設的“全國互聯網廣告監測中心平臺”已采集互聯網廣告疑似廣告信息21.98億條次,準確識別廣告4.16億條次,審核廣告2.87億條次,發現違法廣告174.68萬條次,派發違法案件線索62150件。全國互聯網廣告違法率從監測以前的7.1%下降到了目前的0.6%左右,廣告監測的效果已經得到充分顯現。
作為政府數字化轉型的典型工程,該平臺結合互聯網高科技性、發展性特點,利用大數據、云計算及人工智能等前沿技術,開展重點門戶網站、電商平臺、搜索引擎、廣告聯盟、移動端App和自媒體號廣告的監測檢查,從而為全國各級市場監管部門提供互聯網涉嫌違法廣告線索及相關證據。
據了解,利用分布式爬蟲和SDK采集技術,平臺監測系統可對目標網站進行廣告信息爬取和實時取證,使用60多萬個關鍵詞組合觸發公網搜索引擎,發現和捕捉主流搜索引擎廣告信息。同時,運用移動端廣告信息采集和實時取證技術組成手機陣列,可自動監測App和微信公眾號廣告。針對采集到的信息,監測系統借助語義分析與識別技術獲得結構化、格式化的廣告數據信息,實現了以計算機程序化的方式對互聯網廣告所涉及的內容進行處理,自動識別產品或服務類別、廣告主、廣告內容、廣告發布者等重要信息內容。利用去重和聚類技術,進一步提煉廣告特征、進行數據補全,有效避免系統的重復計算、減少存儲冗余,在提高后續處理效率的同時優化了存儲運算空間。
值得一提的是,監測系統借助多媒體、音視頻內容識別與轉換技術,可將圖片中的文字信息以及多媒體內容中的語音信息轉化為文本字符,對圖片、視頻、音頻方式發布的廣告進行甄別,大大強化了原有的視頻廣告監測方式,進一步提高了監測效率。而支撐以上這些“黑科技”的是TB級的監測運算和PB級的數據存儲分析能力:監測系統采用阿里云成熟技術,利用云計算技術實現計算資源(包括網絡、服務器矩陣、存儲、應用軟件和服務等)的快速部署和靈活組合,從而實現對龐大的大數據集合進行有效存儲、分析和處理。
“隨著近年來網絡經濟的迅猛發展,互聯網廣告因其傳播范圍廣、傳播速度快、違法率高以及更新快等特殊性成為市場監管部門監管和執法的難點。如何利用互聯網最新技術對互聯網廣告實施對等監測,提升事中事后監管能力,正是監管部門迫切需要補齊的短板。”浙江省民營經濟發展中心相關工作負責人介紹,經過4年建設,目前平臺的監測范圍實現了從傳統互聯網網站到移動端App、移動端自媒體公眾號等互聯網內容的覆蓋,從文字廣告、圖片廣告到視頻廣告的廣告形式覆蓋以及全國除港澳臺以外全部省級行政區劃的覆蓋。
在監測能力方面,平臺已經擁有近200臺高性能服務器集群為數據采集、數據分析等子系統提供支撐,公網接入帶寬達到2G,實現了互聯網廣告監測活動從人工到自動、從少量到海量、從小規模到大集群、從數據庫到大數據的跨越式發展進程。目前平臺還在持續推進廣告監測流程和數據交互模式優化創新,設計和打造廣告監測的高效流水線,著力構建聯通廣告監測系統和主要互聯網企業的溝通渠道。
平臺獲取的海量廣告監測數據還為分析廣告投放及信用狀況打下了基礎。在技術和數據支撐下,浙江率先在全國制定了省域范圍的互聯網信用評價機制——《浙江省互聯網媒介廣告信用評價管理辦法(試行)》,目前已經對浙江省100家重點網站開展評價,為市場監管部門對網站廣告發布情況監管工作提供了更為細化的依據。
《中國質量報》