先懂我再用我!淺談大數據與人工智慧服務|老闆學校講座
- 紀錄/李霜茹
「大數據」和「AI」是近年來很夯的話題,好像所有東西加上這幾個字就可以創造無限的商機,市面上關於這兩個概念的相關課程越來越多,連帶著企業似乎也越來越重視相關人才。
但是「大數據」和「AI」真的是萬靈仙丹嗎?這次的老闆學校《大數據與智慧服務》,就邀請了大數據業者 MIGO Corp. 功典資訊 的業務發展群資深總監王克禮,分享新創如何運用有限資源蒐集資料、分析數據;同時也邀請了大數據與人工智慧分析的先行者中華民國人工智慧學會秘書長洪智傑,暢談未來的資料世界與 AI 商機。
AI 人工智慧等於機器人?
每次提到人工智慧,我們總是會很容易想到各種像是《機械公敵》(Enemy of the State)、《A.I.人工智慧》(A.I. Artificial Intelligence) 等等這樣的科幻電影,或是打敗頂尖圍棋棋士的 Alpha Go;大眾似乎對於人工智慧仍是有隱隱的恐懼。講座現場也有律師聽眾提出疑問:「是否在未來,人工智慧真的成熟之際,我的工作就會被取代了呢?」。到底人工智慧能做到什麼?現在的發展到了什麼地方?未來我們又會不會被人工智慧取代呢?
要回答這些問題,得讓我們先來什麼是人工智慧!人工智慧能簡單的分為「強人工智慧」與「弱人工智慧」,強人工智慧指的是能夠像人類一樣推理、得到結論,科幻小說會出現的機器人就屬於強人工智慧;弱人工智慧則是只處理特定的問題,模仿人類做事的模式,不進行推理,目前正在發展的 AI 相關產品大多屬於此類概念。
人工智慧、機器學習、深度學習,傻傻分不清楚
人工智慧包含的學問範疇相當寬廣,過去大家較關注的「機器學習」一學門,是人工智慧中的其中一支,而最近常被提到的「深度學習」,則又屬於「機器學習」中的一種。那什麼叫「機器學習」,什麼又叫「深度學習」呢?它們可以拿來做什麼呢?
「機器學習」就是讓機器從過去資料中學到如何預測或反應未來,簡而言之,就是模仿人類學習過程。洪智傑便拿人類學習的過程來比喻、解釋機器學習的流程,將之分成學習階段和預測階段。
學習階段中,機器學習的「Training Data」是上課的課本,會教機器「3 隻小雞加 7 隻小雞等於 10 隻小雞」,讓機器學會運算的規則。學會之後,機器就會出現一個「Model」,這個 Model 就是我們所謂的「加法」概念。接著到了預測階段,將學習的成果使用在「Testing Data」── 如同考卷,有題目但沒答案,機器運用所學會的 Model 寫出答案。
這些學習過程,在傳統機器學習中分成三種模式。
第一種是監督式學習(Supervised Learning),簡單來說就是「分類」,回答選擇題的問題。它會告訴機器正確答案,像是以前用圖卡學習動物名稱一樣,長圖片的叫兔子,機器因此給那份資料一個「兔子」的標籤。實際應用範例如語音助理 Amazon Alexa,便是用監督式學習幫聲波分類。
第二種為非監督式學習(Unsupervised Learning),簡單來說就是「分群」,不需事先告訴機器哪個資料屬於哪個種類,而是透過觀察把資料分成不同堆,看起來像熊的分一堆、像兔子的分一堆。最貼近生活的實際應用就是 Facebook 廣告,屬性像的人被分群,推播同一種廣告。
最後一種則是增強式學習(Reinforcement Learning),這就像是巴夫洛夫有名的古典制約實驗:在給狗吃東西前先搖鈴,久而久之狗聽到鈴聲就開始流口水。增強式學習會和環境做互動,得到不同的反饋後再做修正,像是有些自駕車的系統和AlphaGo。
上述各種機器學習的目的,是讓電腦學習到達某個程度,使得結果和資料集的誤差最小,出錯的機率最低。深度學習則用來幫助機器學習,它模仿人類腦的神經網路,做出「類神經網路」。「其實也不是什麼新概念,但現在運算能力加快,大數據的產生也讓深度學習有更多資料可以訓練神經元,整體效果越來越好。」洪智傑說。
機器學習需要完成取特徵、做分類兩件事,但深度學習可以讓這兩件事情合併為一個步驟,由機器自己學會什麼特徵是重要的,並做分類。
說了這麼多,實際會怎麼用咧?
「人工智慧光是理論和分類就如此深奧,大企業和中小企業的運用方式更是有所不同。」洪智傑提到,大企業玩 AI ,是用「AI+」的概念,以 AI 技術做出產品,讓人工智慧自己和使用者對話。「舉個著名的例子,Google Duplex 能自己幫使用者預約剪頭髮的時間,並做到讓使用者沒有察覺是人工智慧在和自己對話。」
另一方面,中小企業通常採取「+AI」模式,把自己的產品加上 AI 功能,用 AI 加值商品,例如牧場利用 AI 監控羊隻狀況,判斷哪隻羊生病,以提高生產力。
俗話說得好,不管是「+AI」還是「AI+」,能幫助到企業的就是好 AI。
前面提到,在 AI 的技術裡大數據資料能夠幫助電腦學習出最有效率的 Model,接下來就讓我們來看看,「大數據」又能如何被運用並幫助市場的呢?
你的生活早就被大數據佔據了
「大數據」三個字已經翻炒得熟到不能再熟,音樂、影音軟體中「你可能有興趣的作品」、電商平台的商品推薦,搜尋了什麼就會像鬼魅般跟著你。這些數據到底是怎麼被搜集和運用的呢?就讓專門做 CRM 的大數據業者 MIGO 總監王克禮來告訴你。
王克禮總監表示,顧客最常和他們說「我想要知道我客戶的瀏覽行為、社交行為是什麼。」這是大數據的第一個迷思,知道這些資訊,能夠幫助一個企業改善什麼?他認為,在使用這些工具之前,得先定義企業想解決的問題是什麼,大家都想從數據找答案,但其實你必須先帶著答案去看數據,先知道要解決什麼問題。
第二個迷思則和現在很夯的 Facebook 廣告投遞有關,投遞廣告時 Facebook 會告訴你客戶的輪廓,看起來很方便,實際上對於企業來說卻是「外部數據」。當某天企業決定不再使用臉書,甚至未來臉書式微,累積在上面的顧客數據全都帶不走,無法被導進企業的內部後台系統。
王克禮提醒大家,在汲汲營營於外部數據前,內部數據如顧客資料、交易資料或會員的網站瀏覽行為,已經玩透了嗎?他表示:「內部數據才是王道,外部數據只是一個手段。」
數據轉型的挑戰:解決什麼?誰來負責?
在大數據迷人風潮下,眾企業們無不想利用大數據來提升自己,但王總監認為,在做數據轉型時有兩大主要挑戰,首先為前面提到的企業究竟想解決什麼?有時客戶所提出想解決的痛點,並不是真正的致命傷,要解決的問題不同,企業必須不斷思考問題背後的問題。需要蒐集的數據也不一樣,該如何搜集、成本和風險多大,以及,這些數據可以累積進自家後台系統嗎?
第二個挑戰則是,誰該負責這個數據轉型的整合?一間公司中,不論是行銷、CRM、產品或 IT 部門都有自己的天職與要完成的任務。每個部門注重的重點不同,所需要的數據和方法也就會有很大的差異,這時便需要一位專門彙整的專案負責人。有鑑於此,近幾年有個新職位出現:CDO 數據長。「如何蒐集數據、各部門該怎麼使用,才能發揮數據真正的效果,將是企業數據轉型一個很重要的挑戰。」王克禮說。
你是不是也常常表單填到一半就不想填了?
「蒐集數據沒有想像中容易,每增加一個欄位,就增加了 14% 使用者不把資料填完的風險。因為接觸的資訊多,現代消費者懶惰又多疑,使得蒐集數據有越來越多挑戰。一定要先知道自己想解決什麼問題,再去做有效地蒐集,並且能讓機器完成搜集的事情就讓機器去做。」王克禮再三提醒,一定要搜集能導入公司系統的「內部數據」,好比發送給消費者試用品所得到的個資,就是最直接可以運用的內部數據。
另外,他也提醒大家不要掉進數據分析的陷阱中,「在數據的成效學習裡,需要注意關聯不等於因果。」舉例來說,如果買了相機又買相機包、記憶卡,這是有「因果」關係;但週五晚上買了啤酒的人也會買尿布則是有「關聯」但卻不能說兩者有「因果」關係(註)。
假設今天電商做了一檔活動,最後做完成效分析時,發現在網站上停留 18 分鐘的人,平均客單價超過 100 元,但這其實只是一個關聯,我們不能把這件事解釋成:只要停留超過 18 分鐘,客單就會超過 100 元,進而在網站上做一些拖長使用者瀏覽時間的手腳,這樣可能是沒有效果的。
新零售概念:人、貨、場
王克禮說Migo 正嘗試搭上新零售的列車,幫助線下零售商找到新一波機會;因為我們都知道,就算電商崛起,全世界線上線下銷售比例還是 2:8,仍有八成的消費行為來自線下的實體店面。
在過去,人、貨、場都有自己單獨的服務商,「人」就是 CRM 系統,「貨」有 ERP 系統,「場」到近期開始出現物聯網的設備,幫助監控場域裡多少人進出、停留時間、性別年齡等等,但是最重要的是,該如何把這些數據串連在一起。
電商天生就有搜集、分析數據的 DNA,每一個過程,從滑鼠點進頁面開始,瀏覽過什麼地方、商品是否被放進購物車,至支付結帳、送貨到府,甚至給評價,所有旅程都被記錄下來,這稱作「過程數據」,完整地掌握整個消費者的消費歷程。「但線下做不到這件事情,實體店面完成結帳前沒有任何記錄,只有一個結果數據,完成結帳後也毫無追蹤方式。」他解釋,「Migo 在做的事情是,怎麼樣讓這些線下零售業者也能夠掌握類線上這樣的能力。」
建立識別碼、畫出虛擬會員、再行銷
透過物聯網設備辨別消費者進入店內後的足跡,建立屬於他的識別碼,或許是百貨停車場的車號,或許是使用場域中免費 wifi 所提供的手機或信箱。這些識別碼可以讓商店偵測到顧客停在外面、還是進店了,進店後停留了多久。
有了這些資料,便可以畫出這些虛擬會員的 profile,例如在週一到週五的幾點進店消費的轉化率最高。而因為有獨特的識別碼,還能夠透過數位廣告渠道對消費者做再行銷,當他再次進店時,IOT 設備又抓到這個識別碼,便能推測他被廣告驅動了。
再者因為是數位渠道,商家可以透過消費者最常用的 App 接觸顧客,如愛奇藝平台的 banner、金融新聞等。「但是也不能只停留在這!零售業者的使命是把這些虛擬會員轉變為有名有姓的會員,透過完成這個循環,我們開始挖掘過去不知道的盲點,補齊了線上線下的足跡。」他說。
最後,王總監告訴大家,「不要一直認為大數據是萬能的,搜集才是王道!建立自己的 Data Manage Platform,才是最能為你所用,別再迷信外部數據了。在不久的將來,外部數據廣告只會越來越貴,所以大家快動起來,搜集自己的數據吧!」
注解:
- [1]:某家零售業者在分析結帳數據時,發現每到週五晚上,啤酒和尿布的銷量有正向關聯,調查後發現,週五晚上爸爸買尿布時,通常也會順便幫週末的球賽帶啤酒
留言討論