留言討論


分享本文至 E-mail 信箱

天氣變好了,股市交易量會變好嗎?Kyper 資料庫也許可以給你答案

一位台灣人,如何在一年內站穩美國新創修羅場?答案是一個你聽到爛的名詞:大數據。

大數據(big data)喊了這麼多年,大家都跟著喊,但究竟能夠派上多少用場?事實上,目前真正使用到的數據,只有 1%,其他 99% 都像是沈睡的資料孤島。就像人類的大腦也沒有完全用上一樣,一旦解除封印,就會變成露西(誤),若能完全運用大數據,效果肯定很驚人。那為什麼專家們不多分析一些呢?

華爾街的金融專家們表示:「我也想啊。」他們發明了各種模型與計算方式,透過各種因素交叉比對,找出對應的關係,企圖預測股市。但是收集、整理資料這件最基礎的事,卻一直扯住他們的腳步。

資料不是多就好,能用的才有價值

想像一下,你手上有 excel、pdf、word、html 檔案,裡面都有你要用到的數據,而這些資料都是由不同的人、用不同的標準去建立的,如何整理比較?印出來?(相信我,很多公司都會這樣做)還是全部重新 key 到一個通用的檔案格式,再來分析?

世界上充斥著各種專業資料庫,內容包括新聞、氣候、股市等,但是都用不同的格式紀錄著,我們談的不是幾千、幾萬筆資料,這裡談的是好幾百億筆的資料。(高階的股市交易數據單位,可以精準到秒,甚至毫秒)

如果電腦能夠幫我們讀懂這些資料,然後整理成一張乾淨、漂亮的數據表,是不是能省下超級多的人力與時間,讓我們可以運用比 1% 更多的數據?

目前只有 1% 的大數據真正被應用,還有龐大的資料冰山,藏在底下。圖片來完:ZDNet
目前只有 1% 的大數據真正被應用,還有龐大的資料冰山,藏在底下。圖片來源:Business Analytics

Kyper Data 的創辦人張宗堯,從 MIT 畢業後就負責管理一支避險基金,當時他就覺得分析資料並不困難,真正困難的是收集跟整理資料。

為了解決這個問題,2015 年,他向資料庫權威、2014 年圖靈獎得主 Michael Stonebraker 創辦的 TAMR 公司取經,開發出 Kyper 技術,這個技術能夠突破格式框架,將各種形式的資料自動整理成通用的乾淨數據。

「讓機器幫我們看資料,然後彙整成我們要的樣子,概念就這麼簡單。」張宗堯說,人類看得懂的資料,雖然背後也是二進位方式紀錄的,但機器並不能理解它的意義,Kyper 的技術就是將人類看的資料,轉變成 machine-readble (機器可讀)的格式,這樣就能讓電腦自動幫我們整理資料。

整理資料只是第一步,連結各大專業資料庫的數據,進行關聯性分析,才是 Kyper 的殺手級應用。舉例來說,一位金融系教授想要知道「3 月天氣回暖時,股市交易會否變熱絡?」,他需要連結到氣象資料庫與金融資料庫,然後在他想要的範圍內挖出資料,再請可憐的研究生把兩邊的資料全部輸入到統計軟體裡,才能得到結果。

依照目前的市場作業流程,光是取得資料,加上整理的時間,恐怕要花費好幾個月。「Kyper 已經與全球各大數據庫合作,加上我們的資料處理技術,這個分析過程可以縮短到一天以內。」張宗堯說,Kyper 的技術就像變形金剛電影中的「火種源」,可以將龐大的資料縮成一個小方塊,無論帶在身上,或是塞進胸口都很方便。

龐大資料庫,一秒就 Hold 住

不過,目前已有許多新創公司都在進攻資料庫市場,其中不乏獲得千萬美金創投認可的公司,成立才剛滿一年的 Kyper ,憑什麼對自己如此有自信?這個像變魔術一樣的資料整理技術,真的有那麼神?

「我們一開始與大型資料庫企業談合作,希望能夠獲得他們的資料庫授權,結果他們看完我們的技術之後,不僅取得資料庫授權,他們還決定將內部的資料庫系統換成 Kyper。」張宗堯說,當世界前五大的資料庫公司決定採用自己的技術時,「我知道我們做對了。」

3 月初,Kyper 參與美國紐約 Startupbootcamp Fintech新創競賽,從 400 組應用中取得第二名的佳績,加上路透與 TAMR 的加持,目前從天使輪獲得近 200 萬美金融資的 Kyper,已經吸引多家 VC 排隊等著投資。

目前僅有 11 位員工的 Kyper,未來還有新的商業模式:提供企業內部的資料整合,將不同部門的數據統整成一個大資料池,完成資訊透明化工程。透過 Startupbootcamp  競賽的介紹,未來將與 100 多家企業接觸,開始拓展合作觸角。

隨著雲端運算、資料庫與人工智慧的發展更加成熟,在不久的未來,資料分析也許又將面臨一次天翻地覆的變化,Kyper 能否搭上這波浪頭,趁勢而起,值得觀察。

封面圖片來源:Kyper

關於作者


Kobe Chen

金屬搖滾樂中毒,科技狂熱份子,愛貓人士,愛妻男人,這些都是我。相信台灣不只是鬼島,相信每個人都希望這個世界會變得更好。

留言討論


網站更新隱私權聲明
本網站使用 cookie 及其他相關技術分析以確保使用者獲得最佳體驗,通過我們的網站,您確認並同意本網站的隱私權政策更新,了解最新隱私權政策