透過互惠互利的數據流通創造數據之王公司:《數據的商戰策略》(1)

2020-03-10 05:10

? 人氣

在阿里巴巴時,作者處理部門之間數據互通的方式是首先是找出大家有意願共用的部分,然後安排資源,把這一部分先建設起來。(資料照,BBC中文網)

在阿里巴巴時,作者處理部門之間數據互通的方式是首先是找出大家有意願共用的部分,然後安排資源,把這一部分先建設起來。(資料照,BBC中文網)

「如何確保有足夠的數據來發展人工智慧?需要儲備甚麼樣的人才?」我想大家都忽略了大數據能力的根源來自連接,而連接的基礎是數據的流通標準化,互惠互利才是大數據流程中的永恆關鍵,懂得這個道理的公司會是未來的數據之王。

在拜訪一些公司時,我發現,大家所講的數據來源其實就只有幾個,很少看到「養數據」做得好的例子。也就是說,大數據產業目前面臨的挑戰,並不是沒有好的演算法,也不是沒有好的數據工程師,而是數據來源比較單一。

透過<Google新聞> 追蹤風傳媒

互惠互利—阿里巴巴的數據流通策略

阿里巴巴創辦人馬雲(AP)
阿里巴巴創辦人馬雲( 資料照,AP)

在數據科學成為炙手可熱話題的兩年後,我發現,我被企業管理層問最多的問題是:如何確保有足夠的數據來發展人工智慧?需要儲備什麼樣的人才?我認為,大家都忽略了大數據能力的根源來自連接,而連接的基礎是數據的流通和標準化。老實講,「不在此山中」的企業可能還對由此帶來的痛苦沒多大感覺。

比如,有些CEO 問我,如何打通企業各部門之間的數據,並且防止陽奉陰違的事情繼續發生?以阿里巴巴為例,打通數據,絕對不是馬雲一聲令下就可以解決的問題。從2014 年開始,阿里管理層多次要求各業務部門(包括支付寶)無條件地將數據互通,然而,換來的終究也只是表面的打通而已,底下的人陽奉陰違也是花招不少。比如,我有數據,但是我不告訴你有什麼;就算你知道我有數據,但我不能保證提供給你的是有品質的數據。因為沒有業務關聯,對方很難長期、義務地配合,所以就更不會把新增的業務數據和盤托出了。

在這個人工智慧蓬勃發展的時代,數據的增量比存量多。多變的業務場景,也意味著需要敏捷的數據更新(包括結構)。在你使用數據時,數據本身可能早就出現了定義上的變化,數據斷裂(data broken)指的就是數據已經不能反映當前現實,因此,以這些斷裂數據為基礎的任何人工智慧演算法,都會相應地產生偏差。

這種事情表明了什麼?所有的數據流通必須建立在一個永恆不變的道理上:互惠互利,否則你無法做到對數據進行適時的修正。雖然說高層掌握著權力,但要發揮出整體的數據策略,只靠從上而下的命令是不可能的,還必須依靠從下而上的共建共創,只有這樣,才能實現合力而成的多源異構大數據。所以我一直強調,大數據是自利、利他的成品。

湖南長沙市的無人駕駛公車。(新華社)
公車的監視器在行駛過程中錄下的資料能否與其他企業共享?公車公司當然不樂意,監視器錄下來的數據就是我的資產,憑什麼無條件地交出來?(資料照,新華社)

我舉個例子,公車的監視器在行駛過程中錄下的資料能否與其他企業共享?公車公司當然不樂意,監視器錄下來的數據就是我的資產,憑什麼無條件地交出來?但如果此時一家地鐵公司說,若你願意分享這個數據,我會在地鐵的大螢幕為市民提供公車轉乘資訊,以作為交換呢?又或者,政府主動提供客流量數據,作為其他公車公司主動提供數據的相應回報呢?答案應該就明朗多了。當實現互惠互利時,技術問題也就水到渠成了。

關鍵字:
風傳媒歡迎各界分享發聲,來稿請寄至 opinion@storm.mg

本週最多人贊助文章