行走在大數據時代下的“智者”少帥
——訪Teradata天睿公司大中華區大數據事業部總經理孔宇華
本刊記者鄭昱
“每一秒鐘,新發送的電子郵件就多達 290 萬封。每一分鐘,YouTube用戶就會上傳長達 100 小時的新視頻。全球 92% 的數據都是近兩年新創建的,而且正以每天 250 萬 TB的速度持續飆升。我們身處的大千世界,信息正瞬息萬變。在日新月異的世界發現、適應、掌控機會,就必須展開空前規模的數據分析。”在Teradata天睿公司大中華區大數據事業部總經理孔宇華看來,“數據已經無處不在,通過數據分析,在適當的時機做出正確的決策,決勝在每時每刻。”
30多年來,Teradata能保持快速成長的重要驅動力來自于市場外部的需求以及企業內部的創新。
記者:Teradata是全球最大且專注于數據庫軟件、企業級數據倉庫、數據倉庫專用平臺和分析方案的供應商,已經走過30多年的風雨歷程,30多年正是企業從無到有、發展壯大的過程,對此,您怎么看待Teradata的成長?
孔宇華:Teradata自1979年成立,一直致力于數據儲存、管理、分析等方面的業務發展。
在Teradata成立之時,同時期的軟件公司還有很多,比如甲骨文、IBM等。與這些公司相比,Teradata的獨特之處在于一直專注于數據倉庫,或者說是專注于決策支持和數據分析。Teradata的數據庫就是針對復雜分析而設計的,并通過自我創新及積極并購,不斷豐富在這個領域的領導地位。目前,已經幫助全球2500多家客戶部署了各種數據分析解決方案,并且得到客戶及分析師的廣泛認可。從數據倉庫業務拓展到大數據分析解決方案及整合營銷應用系統領域。
30多年來,Teradata能保持快速成長的重要驅動力來自于市場外部的需求以及企業內部的創新。
外部的需求從上個世紀就開始萌芽,從最早沃爾瑪的數據倉庫,從相對簡單的報表,發展到“啤酒與尿布”的數據挖掘;到進入21世紀以來互聯網、物聯網的快速發展,產生了更加龐大、即時、復雜的數據分析需求。隨著愈發激烈的商業競爭環境,公司決策層需要通過更加深入的客戶行為分析來獲取競爭優勢。
大數據時代的挑戰促使新型技術的不斷衍生。這些外部需求的不斷增長,甚至是爆炸式的增長,成為Teradata這30多年快速成長的外部驅動力。
內部的創新是企業持續發展的核心驅動力:早在1995年Teradata實現了CPU和服務器的虛擬化,不僅能更好地處理數據,還能在Teradata不同的產品之間進行充分資源分配,保護客戶信息隱私。2002年,Teradata實現了主動式動態數據倉庫,能夠管理交易進程的數量,實現對歷史數據的分析。比如,網上的交易歷史數據,不論這些數據是在銀行自動取款機,還是超市的POS機上,我們都可以把它放到實時數據倉庫當中,進行實時的數據交易分析。2010年,Teradata發布了動態企業級數據倉庫,它采用了混合多溫度處理技術,配備了固態硬盤,能夠提升性能,增強功能,讓實時業務智能成為現實。2013年,推出了智能內存——全球首個“智能”內存技術,可以大幅提升大數據解決方案的分析和查詢性能。Teradata不僅通過自主研發及創新來提升產品的競爭力,還積極依據大數據發展的趨勢進行并購,進行整合式創新。2010年底收購Aprimo,2011年收購AsterData,推出統一數據架構(UDA, Unified DataArchitecture),使得Teradata在非結構化、多結構化數據處理及分析的能力更加豐富。近期收購的一系列大數據公司(Revelytix、Hadapt、ThinkBig Analytics等)使其在大數據的元數據管理、集成分析環境、解決方案及咨詢能力更加完美。
熱情(Passion)意味著“積極”,意味著能比別人更早地布局,更快地執行。
記者:過去幾十年來,“數據倉庫和高級分析”是Teradata的主業,也是Teradata的熱情所在。那么,如何解讀熱情在實際工作開展中的效力?
孔宇華:熱情(Passion)意味著“積極”,意味著能比別人更早地布局,更快地執行。也意味著,我們不僅滿足于給客戶“僅僅足夠”的產品及服務,我們還能不斷創新,把下一代的技術帶給客戶,超出客戶的期望值,讓客戶能夠應用Teradata的產品及服務持續保持其競爭優勢。
熱情應用在產品方面,表現為Teradata能不斷推陳出新,讓客戶用到最先進、最領先的產品。比如,在中國市場推出TeradataAster大數據探索平臺時,同步推出了由中國產品研發團隊開發的中文文本分析能力的產品,滿足了中國市場的需求。
熱情應用在服務方面,Teradata想客戶所想,急客戶所急。能夠前瞻性地、全局性地幫助客戶做好規劃;能夠根據每個客戶自身的特點,進行系統架構設計、模型設計、應用開發;能夠把客戶滿意度放在第一位,提供所需要的數據分析平臺產品,及戰略架構咨詢服務、專業顧問服務、客戶支持服務等定制化的高端大數據解決方案。
記者:Teradata近期連續收購三家大數據公司,是“數據倉庫作為‘大數據’拼圖中的重要一環”的充分印證嗎?如果是,請您具體闡述一下Teradata對物聯網時代下大數據的認識?在Teradata的世界里,大數據到底能幫到客戶什么?在具體業務拓展上又有哪些舉措?
孔宇華:根據全球最佳實踐,Teradata建議企業應該培養三種能力,簡稱為IDA。首先是數據整合(Integration)、第二是探索(Discovery)、第三是行動(Action)。”
Teradata的研發、市場、并購策略都與這三個方向相關。最近的并購行為都是與“大數據分析”業務相關:很多大數據實踐初期的客戶會面臨數據復雜性的挑戰,缺乏很好的手段和工具對非結構化及多結構化數據進行元數據管理。而Revelytix是一家聚焦企業信息管理軟件的公司,在Hadoop出現之后,Revelytix將之前積累的一些技術移植到該平臺之上,并發布了新的產品——Loom。Loom負責管理Hadoop里的多元化數據,讓數據科學家可以更簡單地利用Hadoop集群強大的處理能力。Loom擁有自動發現數據集、在數據集上生成元數據等眾多特性,并擁有集成R語言的RESTfulAPI,從而提高Teradata在大數據管理方面的能力。
大數據如何能夠更好地應用到Hadoop上也是當前的技術挑戰之一。Hadapt是一家聚焦SQL-on-Hadoop的公司,提供集眾多功能于一身的數據分析環境,其技術會讓Teradata在大數據處理和分析上如虎添翼。
大數據分析需要人才及方法論的支撐。Teradata已經具備了數據分析的專業人才,在新興技術如Hadoop、NoSQL、Storm等方面,為了能更快地積累相關最佳實踐及知識產權,收購ThinkBig Analytics變成最有效的途徑。Teradata做出收購Think BigAnalytics的決策考慮到一系列原因,其中包括后者在大數據及數據科學應用程序方面具備的知識產權積累、能夠提供幫助員工快速適應Hadoop運作機制的培訓項目、Storm、NoSQL以及其它相關技術。
物聯網時代下,對于大數據提出了更高的要求。既是技術層面的挑戰,也是業務層面的挑戰。不僅要考慮如何應對存儲、管理這些爆炸式的數據,更要考慮如何能夠從這些相對價值密度較低的數據中挖掘出核心價值。這一過程需要管理人員、業務人員、技術人員共同探討數據分析及挖掘的價值。Teradata曾經幫助一家歐洲汽車廠商做車聯網數據分析:一方面,從汽車廠商的角度,從汽車發動機的參數中分析出的故障趨勢、做到故障預警及提出改進優化建議;另一方面從保險公司的角度,對車險投保人評估駕駛習慣,進行風險等級評分,因人而異調整保費,給投保人駕駛風險提醒,改善駕駛習慣。
在具體業務拓展上,Teradata是基于行業進行切入和開拓的。如Teradata在中國的金融行業、電信行業、航空業的數據分析領域是無可爭議的領導者,持續幫助客戶利用大數據分析實現業務價值。其中,物聯網在零售及制造中應用廣泛,希望能把物聯網的相關分析在中國進一步落地。
Teradata在中國遇到了發展的黃金十年。很多中國企業的信息化,特別是金融和電信行業在10年前就已經進入了相對成熟的時期。各個業務系統積累了大量的數據,具有數據整合、分析及決策的需求。這也是Teradata先期進入的行業,將Teradata的全球最佳實踐引入中國,很多國外的領先分析應用逐漸被國內采納并應用。
記者:在對中國市場的拓展中,遇到了哪些問題?存在哪些機遇?取得了哪些成果?哪些值得反思和借鑒?中國大數據應用環境具有什么特點?未來的發展趨勢?
孔宇華:Teradata進入中國市場超過15年,大中華區是Teradata業務增長的重要市場。
近年來,Teradata大中華區的業務增長速度超過其全球業務的平均增速。
Teradata大中華區已有超過十多個行業的客戶,包含公共服務、通信行業、銀行、保險、證券、航空、地鐵、交通運輸、物流、快遞、制造、汽車、零售、電子商務、互聯網、電力能源等。由于大中華區的卓越表現,Teradata總部也持續加強對大中華區的專注和投入,整個大中華區的業務獲得全球總部前所未有的支持。
Teradata在中國遇到了發展的黃金十年。很多中國企業的信息化,特別是金融和電信行業在10年前就已經進入了相對成熟的時期。各個業務系統積累了大量的數據,具有數據整合、分析及決策的需求。這也是Teradata先期進入的行業,將Teradata的全球最佳實踐引入中國,很多國外的領先分析應用逐漸被國內采納并應用。
隨著中國企業信息化的不斷發展,中國市場具有自身的特點和需求。比如,中國的企業治理結構及政府監管體系不同,需要調整原有解決方案的分析方向和思路。另外,由于中國人口眾多,數據量更大,對于系統的容量、性能的要求更高,很多系統的全球最大數據量是中國的客戶,如工商銀行、中國移動,產生出全世界最多的數據。現在經常是國外的客戶來參考國內的一些先進的大規模部署案例。
對于未來趨勢,我認為:
Teradata需要在新行業和客戶共同創新。大數據分析要和互聯網、物聯網不斷融合,要不斷積累和豐富新的分析場景及案例,幫助客戶進行業務創新。
大數據價值的快速落地。新的數據不斷產生、技術不斷更新,如何能夠幫助客戶選擇最合適的技術、最快地實現業務價值將是采取行動避免空談的制勝法寶,進一步贏得客戶的信任。Teradata將通過統一數據架構及大數據從小做起的理念,實現大數據快速落地。
跨部門、跨企業、跨行業的數據整合、分析將是未來業務創新的重要途徑。如何能夠在保護數據安全、數據隱私的基礎上,提供分析平臺,利用數據分析,實現新的業務模式及變革。Teradata具有跨行業的數據分析經驗,整合跨行業資源,幫助企業通過大數據分析拓展新型業務。例如,幫助電信企業通過大數據分析開展金融個人信用貸款的創新業務。
大數據人才、業務及分析的跨界人才將炙手可熱。如何能夠幫助企業培養人才,結合高校的資源培養下一代大數據人才,將是大數據分析推廣的重要關注點。Teradata與復旦大學,華東師范大學等國內一流高校,均簽署了戰略合作協議,共同培養市場需要的大數據復合型人才。
“智者知而行”是Teradata追求的境界。
“知之愈明,則行之愈篤”。數據可幫助發現趨勢,揭示用戶的真實想法,甚至能預測結果。只要認真研究數據,不再用尋常眼光看待業務,快速發現業務的卓爾不群角度。
記者:未來,Teradata的藍圖您還會勾勒出哪些精彩?
孔宇華:真正做到“運籌帷幄,決勝千里”。只要根據可靠的信息做出正確的決策,其余的一切便可水到渠成:客戶增多、營收上升、機會顯現、效率提高。通過分析海量數據,探索可靠的洞察力和行動力,最終做出最佳決策。撥開云霧見真諦,方可切實推動企業和客戶的利益,匯聚最佳決策之涓涓細流,成就競爭優勢之浩瀚江海。
“決策者,決天下”。企業尋求信息和技術是為了提高工作效率。現在越來越多的 CEO 和CMO 在尋找信息和技術來擴大業務機會。CIO不再是運營領導,而是變成了轉型領袖,需要使用信息和技術挖掘新的戰略,開拓新的市場。同時,各個部門的決策者獲得了充分利用數據的權力,因此能夠更快抓住機會加以利用,通過創新解決業務問題,并負責提供卓越的客戶體驗。
“知之愈明,則行之愈篤”。數據可幫助發現趨勢,揭示用戶的真實想法,甚至能預測結果。只要認真研究數據,不再用尋常眼光看待業務,快速發現業務的卓爾不群角度。每家企業的數據和員工都蘊含著不同尋常的潛力。Teradata的目標是利用獨特而強大的數據分析,幫助客戶盡快釋放這股潛力,有效運用這些新知,增強業務優勢,Teradata改善世界每一個人的生活。
“知之愈多,則行之愈端”。盡管技術能夠帶來更好的決策,但建設更美好的世界還要靠我們每一個人,需要我們每一個人的共同努力。我們希望把數據真正用到更廣泛的方向上,造福全人類的生活。
《中國自動識別技術》 2014第6期(總第51期)http://www.aidchina.com.cn/gdft/4589.htm