">
“比如說數據質量,大家都知道數據質量在人工智能和模型訓練方面的重要性,你的網絡再先進,你如果沒有好的數據依然是無法取得好的效果。但是,如何獲取高質量的數據呢?有很多的方法,我們早期也吃了很多虧,就以缺陷檢測為例,生產線上我們可以看到有很多的缺陷,100多種缺陷。但是我們怎么去采集這些缺陷,我們需要采集多少種缺陷的樣本,每個缺陷我們需要采集多少張圖片,模糊的缺陷我們如何去判定,如果一個圖片有多種缺陷,我們按哪種缺陷判定和標注,這些都是一些很細節的問題,但是會非常影響模型最終的效果。”
除了計算機視覺,人工智能在工業領域的應用還包括數據智能、決策方面的一些應用。明略科技依托他們的數據中臺和知識圖譜,探索異地專家如何將經驗進行積累和沉淀。
比如明略科技為某家軸承生產廠商構建了產品的知識圖譜以及智能問答與選型的系統,用來解決用戶對軸承以及相關產品信息的咨詢查找對比和推薦的問題,相比于傳統的基于人工的客戶服務,這一套智能問答系統能夠取代人工回答60%-80%重復的、常見的問題。
雷鋒網了解到,不管是液晶面板的缺電檢測,還是用戶對軸承以及相關產品信息的咨詢查找對比和推薦,目前AI主要用在工業領域的應用數據的可視化分析、預測性維護等,另外還可用于自動分析設備故障情況等,向著更多細分的工業場景進行滲透。
然而,當每一位創業者、變革者拿起AI的工具叩響工業之門時,撲面而來的不僅有工業機理、工業模型的屏障,還有數據和專業知識缺乏帶來的一些挑戰。
需要突破的障礙
盡管我們知道AI在工業領域有眾多場景和可能性,但是,要達到產業級應用,我們還必須對它有更為清晰的認識,知道工業AI存在哪些問題。
英特爾中國區物聯網事業部首席工程師及首席技術官張宇博士表示:
“人工智能這個詞最早是1956年在達特茅斯會議上出現,其發展可以說是起起伏伏。如果和上世紀90年代——上一次的人工智能高潮相比,除了算力和數據,我們在某些領域的進步并沒有那么明顯。”
“算力方面,英特爾一直在摩爾定律的推動下,帶領整個半導體行業前進,其算力不斷地進行更新。比如超算領域定期頒布的世界500強的超級計算機的榜單,這個榜單第一次發布在1994年,當時榜單上排名首位的超級計算機浮點運算能力每秒鐘峰值1300億次,而去年年底的榜單排名首位的超級計算機浮點運算能力每秒鐘峰值21億次。算力的提升,對于運行一些比較復雜的算法是很有幫助的。以前一些網絡可能相對比較簡單,層次比較淺,現在可以用我們的算力運行比較復雜的網絡模型得到更好的結果,或者我們可以在消耗網絡模型下,在更短的時間里得到結果,實現更快的迭代,算力確實極大的推動了人工智能的發展。”
“另一個推動因素是數據方面,還是以ImageNet為例,ImageNet里已經包含了超過1400萬張經過標注的圖片,所以有了這么多大量的圖片,就可以訓練網絡,得到一個可以運行的比較理想的結果。在數據增長的背后,實際上它的基礎是我們在存儲領域以及通信領域技術的提升。以存儲領域為例,可以看到上世紀90年代,那時候移動存儲的介質是用磁盤,一個磁盤的容量不過幾個M,而現在用U盤,隨便一個U盤就是幾個T的容量。也就是說,我們的存儲技術擁有了百萬倍的提升,這些提升都推動了人工智能的發展。”
4月23日,在工業互聯網產業聯盟(AII)發布的《工業智能白皮書》中提到,當前工業智能的應用以點狀場景居多、普及范圍有限、還存在許多問題尚無法解決,仍處在發展的初級階段。工業智能應用面臨的四大問題分別是:
實時性問題。現有通用計算架構與芯片尚無法滿足工業實時性所帶來的計算要求,端側推理需求迫切。
可靠性問題。電商平臺的推薦系統達到 60%-70% 的準確率已經算是比較高的精準度,而部分工業領域、部分工業核心環節對推薦參數的準確性要求是 100%,一旦參數出現任何問題,將對生產、制造等環節,甚至生命財產安全產生巨大影響。
可解釋性問題。在冶煉、核電等工業領域核心環節所面臨的問題如果期望 通過數據技術解決,則此類問題的解決必須建立在可靠的工程 / 科學突破上,即需要能夠明確 解釋其背后機理。
適應性問題。通常包括模型間交互、軟硬件適配與算法的數據、任務適配三類問題。
“就工業智能來說,總的判斷還是處于起步階段,還沒有達到成熟。”張宇表示:
“重要的原因是,現在的人工智能還是實驗科學,不是一個理論科學。雖然能夠有一些網絡證明它在處理某些問題的時候是有效的,但是還不能夠說明它為什么有效,以及有效的機理是什么。人工智能網絡對我們來說還像一個黑盒子,我們不能預測它有效的原因以及如何進一步優化的方向,這些都是我們現在需要進一步提升的地方。如果這些問題不能達到進一步的完善,那么人工智能還不能稱為成熟。同樣地,工業也是一樣,工業不過是人工智能的一個分支,在大背景環境下可以看到有些人工智能網絡可以開始越來越多用到工業領域,通過我們拿到的一些工業數據來訓練它,讓它在某些特定環境下能夠有效,但是,這個有效也是局部有效而不是全局,因此我們需要不斷地用更多數據進一步完善和推廣。
工業領域的難點在于工業領域的應用場景比較碎片化,和我們熟知的交通領域、安防領域有很大不同。交通領域、安防領域識別的物體相對比較固定,場景也比較固定,這樣可以針對這些場景可以收集大量的數據,得到一些網絡模型以后,可以在這些場景里大面積推廣;而工業場景的碎片化很明顯,比如在紡織工廠里做一個產品的識別,在半導體工廠里也做產品的識別,但是它們要檢測的目標是不一樣的,那帶來的問題是需要不同的樣本和設計不同的網絡結構,在設計方面要用不同的方法進行調優,同時工業本身對準確度的要求很高,因而,在工業領域推廣人工智能的話還有很長的路要走。”
而創立了思謀科技的賈佳亞表示:“越是基礎設施、關系到國家社會生產力的部分,越是需要我們的綜合科技能力去全面落地解決經濟生產里的缺人力、淺智能的問題。實現全面系統化、智能化、自動化是思謀瞄準的解決方案。思謀的企業目標是擺脫單個算法領域的數據局限,以系統化體系架構開創AI 2.0時代。”
現如今,AlphaGo已經是世界頂尖人工智能科技了,要研發出比AlphaGo復雜一個數量級的,能夠替代運營管理任務的人工智能,看上去還是很久遠的事情。就如《1%的征程——阿里云工業大數據解決方案》中所述,人工智能科學家們已經在某個輸出指標維度有了一定研究,并且誰也不知道未來的增長是線性的,還是指數性的?全面的研究成果是百年之后得出,還是十年之后得出?
有專家分析,工業AI之所以一直都被看做是最難的、也最復雜的應用領域,原因就在于,一方面行業外延十分廣泛,細分領域很多,要求的專業知識也很廣泛,因此一直沒能誕生能夠吃透整條產業鏈的巨頭玩家,而AI技術企業想要深入進去更是會遇到各種各樣意想不到的難題。
那么,誰將摘下工業AI這頂“王冠”,成為這個領域的獨角獸企業?