大數據  

書名:大數據(Big Data)  作者:麥爾荀伯格、庫基耶(天下文化出版)

/以斯帖統計顧問公司整理

 

 「巨量資料」、「海量資料」、「大數據」這一類的字眼,都是big data的翻譯,麥爾荀伯格(Viktor Mayer-Schonberger)和庫基耶(Kenneth Cukier)這兩位最頂尖的巨量資料專家,合寫的這一本《大數據》,書中提到幾個重要的觀念,使我們對「大數據」有了初步的概念

 

1.「更多資料,樣本=母體的時代來臨:過去資料不足的時代,也就是小量資料的時代,由於很難掌握到全體的資料,只好抽取樣本,發展種種統計技巧去推估母體的概況。但是在巨量資料時代,掌握全體的資料已不是夢。巨量資料的「巨量」不是絕對、而是相對的概念,指的是有完整的資料集。

2.「擁抱不精確,宏觀新世界」:容忍各種不精確(也就是雜亂),可能是件好事,放寬允許的誤差值,手中就有更多的資料,就更能看到全貌,資料量增大的時候,我們常常會需要接受雜亂的事實,並從精確走向可能性。

3.「找到相關性,不再拘泥於因果關係」:在原本小量資料的情境下,相關性就已經相當實用,而巨量資料靠著相關性,我們對事物的觀察就能更快、更輕鬆、也更清楚。在分析某個現象時,不用抽絲撥繭找出它運作的道理,只要找到有用的指標即可。靠著相關性,就能抓住現在,預測未來。

4.「資料化當一切成為資料,用途無窮無盡」:巨量資料的真正核心概念,其實是延續了人類自古以來,希望測量、記錄和分析世界的期許。為了取得可量化的資訊加以資料化(datafication),必須知道測量的方法,以及如何記錄測量到的資料。有了資料化,就能重現人類活動。有了量化,就能夠進一步預測、規劃。

5.「價值不在乎擁有,只在乎充份運用」:資料除了能夠為同樣的目的重覆使用,更重要的是,還可以為不同的目的而重覆使用。在過去,一旦資料完成原始用途,我們常常就認為資料已經完成目的,似乎所有關鍵價值都已釋放完畢,但到了巨量資料時代,資料就像一座神奇的鑽石廠,就算已取得主要價值,還是能不斷繼續開採,甚至與它資料結合,靠著全新方式混合資料,就能達到創新。或者一開始就加入可延伸的設計,讓資料適用於多種用途。

6.「蘊涵資料價值鏈的三個環節」:與巨量資料相關的公司,目前可分為三種類型,分別提供不同的價值:資料、技術、思維。到目前為止,資料已經很豐富,相關的技術仍然很欠缺。近年來也出現了「資料科學家(data scientist)」這個新的專業,結合了統計學家、軟體工程師、圖表設計師的技能,而且擅長講故事、從資料庫中探索其中的神奇,他們可以說都已站穩了未來的夢幻位置。巨量資料的價值鏈主要分為:(1)資料持有人、(2)資料專家,擁有專業知識或技術,能夠進行複雜分析、(3)有巨量資料思維者,他們能早別人一步看到機會,就算手中沒有資料。

7.「風險巨量資料也有黑暗面」:巨量資料的負面影響其實比一般想像的還高,使用巨量資料的時候,如果不尊重隱私、誤用預測、曲解資料的意義,造成的後果,輕則使客戶或員工受到委曲,重則可能使公民受害。若不妥善管理巨量資料帶來的風險,巨量資料所造成的危害就像巨量資料本身的規模一樣巨大。

8.「管控打破巨量資料的黑盒子」:從核能技術到生物工程等種種新興領域,都是先發明了一些工具,但後來發現可能造成危害,這時才開始著手制定相關的安全機制,巨量資料是我們這一代人需要避免的強大科技危害,為了確保科技發展不會犧牲全民福祉,巨量資料的發展也必須維在全體民眾所能管控的範圍內。

9.「巨量資料只是工具,勿忘謙卑與人性」:我們能蒐集和處理的,永遠只是世界上一小部份資訊。因為不可能得到真正完美的資訊,預測就必然可能錯。但這並不意味著預測總是有誤,它只是永遠無法完善。巨量資料提供的見解仍有參考價值,只是,巨量資料永遠都僅是工具,而不是要提供最終解答。這是目前夠好的最佳選擇,未來還有待出現更好的工具,讓我們取更好的答案。這也代表,使用這項工具的時候,我們必須擁有更多的謙卑,以及許多的人性。

 

作者簡介

麥爾荀伯格 Viktor Mayer-Schonberger

  牛津大學網路研究所教授,
  並擔任微軟、世界經濟論壇等大公司和組織的顧問,
  是大數據(巨量資料)領域公認的權威,
  寫過八本書以及上百篇專論。

庫基耶 Kenneth Cukier

  《經濟學人》雜誌資料編輯,巨量資料思潮評論員,
  經常於《紐約時報》、《金融時報》、
  以及《外交事務》期刊發表財經文章。

 

以斯帖統計  

好友人數

文章標籤
創作者介紹
創作者 estat 的頭像
estat

blog.estat.com.tw

estat 發表在 痞客邦 留言(0) 人氣()