提到人工智能(AI),大多數(shù)人的第一反應就是它距離我們太遠了,什么智能機器人,什么無人駕駛,這些好像都是未來式。其實,很多人都想不到,人工智能就在我們身邊,而且在我們不知不覺中已經(jīng)做了很多事。比如,它已經(jīng)可以初步勝任流水線工人、電話銷售、客服、普通記者、行政人員等工作崗位。
最近,人工智能又找到一份新工作一打假專家。這次,它究竟干得怎么樣呢?
如今,隨著互聯(lián)網(wǎng)和新媒體技術的高速發(fā)展,網(wǎng)絡在給人們的工作生活帶來極大便利的同時,大量虛假的或者引人誤解的內容也乘虛而入,嚴重污染了網(wǎng)絡空間,使得傳播的信息魚龍混雜。
要想不被網(wǎng)上的流言和謠言蠱惑、傷害,就需要對其進行科學甄別。那誰是做這個工作的最佳人選呢?謠言千變萬化,有些一眼就能識破,但有的半真半假,不深入調查研究,還真不好分辨,如此大費腦力的事,還是交給專業(yè)人士吧!
據(jù)了解,目前國內主要的識謠、辟謠平臺,基本上還是依靠著專家識別的模式。但我們來看這樣一組統(tǒng)計數(shù)據(jù):目前大型聚合類資訊平臺每天的新聞發(fā)布量一般在50萬條以上。另外,在網(wǎng)絡上,每分鐘都有數(shù)百萬的在線互動。試問,在這個信息爆炸的時代,人工識別能跟上信息產(chǎn)生的步伐嗎?完全依靠人工來消除假新聞還現(xiàn)實嗎?
這時候,AI就可以大顯身手了。除了在智能機器人、計算機視覺、深度學習、語音識別、手勢控制等高科技領域被廣泛應用,科學家和工程師又幫它修煉出“火眼金睛”,委以打假重任,它正在成為守護網(wǎng)絡信息安全、構筑社會信用價值體系的有力武器。
為了提高識謠效率,中國科學院計算技術研究所、阿里巴巴、騰訊等多家機構和企業(yè)已經(jīng)開展了人工智能識謠工作。
AI識謠公眾平臺具有針對謠言的多重“殺手銅”:
1.可自動及時地發(fā)現(xiàn)可疑線索并進行認證,大大降低謠言可能帶來的危害。
2.通過機器學習算法輔助人工審核,僅需1分鐘即能對疑似謠言事件發(fā)出預警。
3.基于數(shù)據(jù)驅動的方法,平臺還可不斷挖掘出不同類別謠言的特性,實現(xiàn)對各種謠言的自動識別。
另外,AI可以24小時工作,以遠超人類的效率對文本、視頻、圖像和音頻進行分析。相比于人類,AI處理新聞的數(shù)量和檢測的有效性更高,而且不會感到疲憊。
雖然AI辟謠應用前景一片光明,但要完全替代人類,尚需時日。虛假信息識別是一個高度復雜的問題。目前,機器學習算法的準確率尚不足以完全取代人類,但已能夠輔助人類更快更好地審核新聞。
從核心技術上說,AI甄別謠言依賴于“三多”。哪“三多”呢?
一是多模態(tài)數(shù)據(jù)。即AI必須通過大量的數(shù)據(jù)類型來進行學習和練兵。在謠言從發(fā)布、傳播到被辟謠的生命周期中,可能會伴隨產(chǎn)生文字、圖片、視頻、傳播網(wǎng)絡、參與用戶屬性等多種模態(tài)的數(shù)據(jù),各模態(tài)數(shù)據(jù)均能不同程度地指示謠言,但沒有哪種模態(tài)的數(shù)據(jù)擁有獨立完全的謠言指示能力,所以要盡可能獲取不同模態(tài)的數(shù)據(jù)。
二是多層次表示。即AI在深度學習的基礎上,會自動對模態(tài)數(shù)據(jù)進行區(qū)分組合。由于AI的深度學習技術有強大的表示學習能力,經(jīng)過神經(jīng)網(wǎng)絡結構和融合機制的設計,AI模型可以在面對眾多意義、形式、結構都不同的模態(tài)數(shù)據(jù)時,綜合不同層次數(shù)據(jù),自動找出最有區(qū)分能力的組合,并將待甄別文章對應的文字、圖片、傳播網(wǎng)絡等融合投射到特征空間中。
三是多角度判斷。即AI可以單維度也可以多維度綜合分析后給出可信度的判斷。AI可以從單一方面(如內容、用戶、傳播)給出可信度,也可以全面觀察,給出綜合所有信息的可信度,及時幫助人們“揪出”可信度不高的信息。
還有一個大快人心的消息,除了能鑒別虛假新聞和圖片,AI虛假檢測技術還可以應用在對虛假商品的檢測上,如基于視覺信息技術鑒定商品的真?zhèn)?。例如,識別假冒名牌包的專家,一般工作一天只能鑒定五六個包,而AI篩查一個包僅需幾分鐘。實際操作中,AI先在大量篩選中發(fā)現(xiàn)異常情況,報警示錯,再由專家來做進一步甄別,即以AI技術打假為主、以人工審核為輔。
AI如何識別假貨
其實,在大量的商品中,正品還是占大多數(shù)的,仿品只是占一小部分。虛假商品檢測就可抽象為異常檢測問題,這時候就要對大量正品進行數(shù)據(jù)建模,對待檢測的樣本只要看它與正品相比是否存在異常。但單純的數(shù)據(jù)學習是困難的,鑒別中還要結合鑒定專家的經(jīng)驗知識,以引導模型學到快速定位異常區(qū)域的能力;同時,模型通過數(shù)據(jù)驅動發(fā)現(xiàn)的視覺經(jīng)驗規(guī)律,也會反饋給專家。因此,這是一個專家和模型相互學習、迭代提高的過程。
近幾年,拼多多、京東、阿里等電商企業(yè)都愈加重視AI技術在商品打假中的應用,加大了研發(fā)投入。