2018年1月9日 星期二

【王博專文】你不可不知道大數據起手式 vol.3-Big Data的美麗與哀愁

談到數據分析中的挖礦法則,開始有人疑惑,聽起來大數據就像一台產量豐沛、物資充足的列車,但怎麼說都好像跑去不該跑的路線,停靠不該停的站點,是不是大數據只是一場虛幻的哄抬?

事實上採用大數據分析,得到良好結果的案例非但不是沒有,事實上相當不少。


案例1:Tesco PLC(特易購)和運營效率。這家超市連鎖在其數據倉庫中收集了700萬部冰箱的數據。通過對這些數據的分析,進行更全面的監控並進行主動的維修以降低整體能耗。(當然這家公司後期也因找錯方向導致一次可怕的失敗,有機會再跟大家補充)

案例2: 沃爾瑪的搜索。這家零售業寡頭為其網站Walmart.com自行設計了最新的搜尋引擎Polaris,利用語義數據進行文本分析、機器學習和同義詞挖掘等。根據沃爾瑪的說法,語義搜索技術的運用使得在線購物的完成率提升了10%15%
(對沃爾瑪來說,這就意味著數十億美元的金額。)

案例3:  全球零售業巨頭沃爾瑪啤酒+尿布。全球零售業巨頭沃爾瑪在對消費者購物行為分析時發現,男性顧客在購買嬰兒尿片時,常常會順便搭配幾瓶啤酒來犒勞自己,於是嘗試推出了將啤酒和尿布擺在一起的促銷手段。沒想到這個舉措居然使尿布和啤酒的銷量都大幅增加了。
(如今,「啤酒+尿布」的數據分析成果早已成了大數據技術應用的經典案例)

案例4: 印度Satyamev jayate電視節目。該節目整理並分析社會民眾關於爭議話題的各種意見,包括女性墮胎、種姓歧視和虐待兒童等社會熱點問題,並使用這些數據來推進政治改革。

案例5: PredPol Inc.PredPol公司通過與洛杉磯和聖克魯斯的警方以及一群研究人員合作,基於地震預測算法的變體和犯罪數據來預測犯罪發生的幾率,可以精確到500平方英尺的範圍內。在洛杉磯運用該算法的地區,盜竊罪和暴力犯罪分布下降了33%21%

以上的成功案例僅僅只是少數幾項,透過運用大數據分析成功的企業或是展望確實不斷產生,但身為相關從業人員、研究者以及趨勢觀察者,我們卻持續不斷地在各種會議場合、研究文獻以及網路平台上宣稱:不要陷入大數據危機。

主要的問題在於人們一窩蜂地崇拜著Big Data,彷彿眼中只能見到它的美麗,卻忽略了我們曾經提過的「倖存者偏差理論」,還有我們之前舉過的失敗案例。

我們必須正視Big Data的哀愁。

通常你想在網路上檢索大數據的失敗案例,會發現為數不多,甚至10篇文章中,至少有9.5篇舉的都是GFT的案例,這下子你想,原來只是嚇唬我們。

別忘記,有太多失敗的案例連端上檯面的機會都沒有,就悄悄被公司當作一段黑歷史掩蓋過去,這就是為什麼我們多數只能看見成功案例卻始終聽見處處警告。

接下來的幾個關鍵字請你先熟記:
選擇錯誤的數據、問了不正確的問題、缺乏必要的技能、無法預料的問題、大數據孤島、惰性與迴避。

以上就是大數據分析的哀愁,下一回,我們會針對這幾個關鍵字來進行探討。

沒有留言:

張貼留言

【面對全球經濟轉型重要技能需求】

【面對全球經濟轉型重要技能需求】 世界經濟論壇(World Economic Forum, WEF)長年關注經濟轉型的各項趨勢,也定期發佈未來的工作(the Future of Job Report)報告,根據對各國產業界的調查與訪談,深入分析當前的經濟現況與...