多年經驗老兵談大數據AI本質:大多物流企業已陷入了誤區
近日關注到某通物流新成立分公司招聘數據工程師,招聘要求如下:
任職要求:
精通HiveSQL,有較豐富的HiveSQL性能調優經驗
優秀的分析問題和解決問題的能力,對解決具有挑戰性問題充滿激情
熟悉至少一項分布式計算平臺,例如Hadoop,Spark,Hive,Storm,Kafka等
至少熟練使用Shell、Python、Perl等腳本語言之一
了解數據倉庫建設基本思路,有數據倉庫建設項目經驗
結合這樣的招聘要求,今天我想以自身多年的系統開發及產品管理經驗,給大家分享一些心得,希望對大家有所有幫助。
一個誤區:業務在線化尚未實現,已經在談大數據及AI
首先,我們來看看大數據的含義:大數據是指數據量級大到現有的軟硬件無法從中獲取“合理的、科學的、或者有意義的知識”。一般常用的處理工具是Hadoop,Spark。
其次,人工智能(Artificial Intelligence),英文縮寫為AI。簡單的理解就是用計算機程序從已有的大量數據中計算出需要的結果。
毫無疑問,基于當前計算機技術能力的發展這兩者必然會改變未來,尤其是物流行業這樣一個操作密集型的行業。當下物流企業的高層技術管理人員,對這兩者賦能物流企業寄予厚望。
從本文開頭任職要求可以看出,這個大型物流企業在以處理大數據要求招聘數據開發工程師,那么作為新興部門或企業,是否有必要招此類開發工程師?是否能接地氣,實用性高不高?
數據處理分析就如同一個廚師將各種食材,進行加工處理,得出一道美味的菜肴。所以數據原材料是數據分析師處理的“食材”,數據處理加工的工具如同加工過程中的烹飪工具,處理結果就是最后的“菜肴”。那么如果烹飪工具很高級,廚師技術很高,但是食材缺乏,怎么能做出美味的“菜肴”?
食材分多種,有基礎食材,有清洗后食材,有刀切完成的食材。下圖表示數據分析與基礎工作流程的嵌套邏輯:

上圖還可以用另外一種實際操作場景予以表述:
底層表示最基礎的數據采集層,比如商品出售時掃描商品碼是第一個采集數據行為,然后客人用相應的支付寶賬號進行付款,這是第二個需要采集的數據。最基礎的數據采集,表示在第一現場做的行為的數據記錄,這是我們進行數據分析的前提,這期間如果數據的采集量極其大,那么需要用處理性能高的服務器與工具,此時Spark就能發揮作用。這個底層系統我們一般稱為基礎業務系統;
中間第二,第三層是數據分析加數據采集,比如根據商品流動排名分析(這是第一層數據分析的結果),店主購買排名第一的銷售商品,這是第二層的采集行為,其建立在第一層分析基礎上,以分析結果作為第二層數據采集的起點,向后延伸采集更多的數據,這兩層管理系統,我們稱為業務管理系統。
最上面一層是數據結果層,比如該商品根據流出與采購下達,預計某個具體日期的庫存量,并作出相應的補貨或促銷推薦。這是最后展示及可被系統自動推薦用于決策的數據。整個過程完成了所有數據處理及人工智能。一般這個層次是最后的數據呈現層,一般使用BI工具進行數據分發。
上面這個例子說明數據分析與流程嵌套之間的關系:沒有基礎采集準備就沒有可分析的材料,沒有數據分析的結果作為二層管理流程的起點就沒有后續的采集節點。數據分析與流程相輔相成,這是為什么我在上一篇《聯盟成網之“坑”》中說到依附于體系的流程探索如繡花,需要試錯與積累,逐層細化,從而讓系統流程覆蓋率逐漸提高,數據協調能力提升,管理能力才能穩健的原因。
可以想象,巧婦在做無米之炊的時候,她只有兩個選擇:1.去自己找米;2.不做飯了。對數據開發工程師來說就是:1.我去填基礎數據采集不全的坑;2.我離職不干了。
填坑的場景在物流網絡中如下:你想讓數據開發做分撥更優的人員模型配置,現在貨物已經做了條碼標記,流轉過程中可以進行掃描記錄,但是場地分揀貨裝卸操作過程中,庫位未標記,人員標記也未記錄到系統中,根本無法知道現有人員的效能。數據開發工程師等著業務部門去布設流程開發基礎業務操作系統太慢了,自己直接沖進去做基礎操作系統了。
上述情形說明一個優秀的數據分析工程師在條件完備的公司下可以很好地利用他的能力為管理者提供更好的決策依據。在一個條件尚不成熟的企業,寧可潛心做管理建設與體系打造,不要過早引入大數據分析工程師,造成企業成本浪費與優秀人才信任透支。
電商類行業以互聯網為基礎發展而來,本身是在線化產物,大數據AI的應用往往集中在此,這也是市面上近期大數據分析工程師這么火熱的原因。物流行業本質上仍是傳統行業,互聯網信息技術只是幫助物流提高效率,國內物流任何一家企業說他在線化已經完全實現為時尚早,所以國內物流且應該更多反觀自己內部的信息化進度,先少關注一點高精尖技術。
AI核心本質是人工建立的算法模型,讓計算機語言將人腦中的算法模型予以表現。市面上經常會說一些數據分析的方法論:回歸分析、聚類分析、神經網絡方法等。在實際模型建設中,這些方法論能幫助實際應用模型的作用微乎其微。更多的是從實際場景與需求出發,把專業人士多年的經驗從大腦中進行提取,歸納,抽象。人腦中的經驗與精華才是人工智能的“本”,代碼與軟件實現是“末”。
希望物流行業越來越多人能認識到大數據與AI的本質,不去做看皇帝新裝的看客。
相關文章
絕不能再救美國第二次!美陷入危機發出求援,專家說出很多人心聲
既然如此,很多人對美國不滿是理所應當的,可至于到底幫不幫,或許我們應該把美國政府和美國人民分開來看,就像美國一些民間組織在我國抗擊疫情時捐贈物資一樣,我們可以考慮也以民間捐贈的方式回饋他們,而馬云等人,正在這樣做。
工程院院士鄔賀銓談物聯網本質
物聯網是站在互聯網上面,但是并不等于誰都可以接進去的,電力系統的物聯網只有電力系統才能連進去,交通的只有交通的可以接進去,所以它實際上是個專用網。
智能時代來臨 家居陷入“硬”與“軟”的較量
近期,中央電視臺播出網絡安全專項調查,曝出國內家用路由器重大安全隱患。報道稱,在對上億用戶的路由器進行檢測之后發現,中國目前5%的路由器已被黑客成功控制。
工業物聯網誤區之工業物聯網需要新建設施
一些企業領導者認為,老舊的設施會阻礙數字化轉型,因此必須更換。新設備固然必不可少,但構建工業物聯網不等同于新建一個“全自動化的‘熄燈’設施”。工業物聯網的大部分價值源于改善原有設施:比如連接和優化現有基礎設施,定期增加新機...
對電橋傳感器進行電路設計時如何避免陷入困境
儀表放大器可以調理傳感器生成的電信號,從而實現這些信號的數字化、存儲或將其用于控制信號一般較小,因此,放大器可能需要配置為高增益。