資料科學家(data scientist)是一個近幾年被廣泛談論的職業,2012年美國哈佛商學院的指標性刊物─哈佛商業評論 (Harvard Business Review)以『21世紀最性感的職業』介紹『資料科學家』(data scientist)在巨量資料(Big data)分析上的價值與定位,而您聽過或是知道何為『資料科學家』?
在一份科技報(Tech orange)對中研院資訊科學研究所的副研究員陳昇瑋的專訪中提到:「資料分析的歷史不是現在才開始,…資料科學家其實早就存在,差別只在是否能夠以創新的作法,利用資料、分析資料而已。」
一般人想到資料科學家,便會與巨量資料(Big data)聯想在一起,Google、Facebook、全球最大的職業社交網站LinkedIn等網路公司,擁有全球最大的Big data,為決定網站功能,他們導入資料分析的技術,以採掘出有創意且有價值的資訊,資料科學家在這環節即扮演了重要的角色。陳昇瑋說:「Big Data 指的是所涉及的資料具有Volume(量大)、Velocity(進入和處理速度快)、Variety(變化大)這三個特性。若要以量來定義,有一說法是,Big Data 至少要在數十 TB(Terabyte)到數 PB (Petabyte)之間。」【註:1PB=1000TB】,但事實上要符合Big級資料量的案例並不多,在台灣更少。
因此,資料科學家分析的範疇並不侷限於Big data,乃是透過運用資料分析的技術,創造更高的商業附加價值。網路資訊雜誌轉載一篇關於LinkedIn如何利用資料分析技術決定網戰功能的文章,文中提到:「LinkedIn的收入主要由人力解決方案(即招聘)、市場解決方案(精準廣告)、訂閱產品(針對個人的付費加值服務)構成…實際上,LinkedIn的這一整套業務,尤其是商業模式,是由資料分析和處理能力驅動的。」而陳昇瑋與Gogolook團隊分析 Call Pattern,研究詐騙電話的行為模式,也為10人團隊創造5.3億的價值,目前已賣給韓國最大的網路服務公司 NAVER。
究竟什麼人可以成為資料科學家?資策會的課程招生文案中,出現引人注目的文字:「成為擁有百萬年薪的資料科學家,從這裡開始…當上資料科學家,等於擁有一張年薪百萬元的入場券。」玉山銀行人資長王志成表示,資料科學家是銀行業競爭的秘密武器,因此升遷的機會也比其他職位多得多,而且預計工作三年左右,年薪至少超過百萬,是目前正夯的職業(SAS, 2012)。當巨量資料在全球方興未艾之際,根據SAS(賽仕)公司的統計,總計全球企業約需170萬名資料科學家。在台灣,Big Data的應用雖然才剛剛萌芽,但是要面臨的幾項重大挑戰,除了資料分析人才不足之外,其他還有在地顧問服務不足以及對資料價值的敏感度不足的問題,而這些因素都將影響巨量資料在台灣市場的發展(SAS, 2013)。資料科學家的工作職缺,從2011年開始急速攀升,成為前10大熱門職缺。中華資料採礦協會榮譽理事長謝邦昌認為:「許多人以為只有大型企業才需要資料分析演算,但事實不然,即使是中小企業,同樣存在解析Data的需求。預估台灣需求的人力,大約會是在1萬名以上。」(余采霏, 2014)