研究與觀點
RESEARCH & IDEAS
更新:2014年07月(yue)02日(ri)點擊:14644
北(bei)京集慧智佳知(zhi)識產權管理咨詢有(you)限公司 曹之晨 王(wang)尚麗 何珊珊 呂麗君
云計(ji)算(suan)是隨(sui)著多(duo)核處理器、虛擬化(hua)、分布式存(cun)儲(chu)、寬帶互聯網(wang)和(he)自動化(hua)管(guan)理等(deng)技術的(de)發展而產生的(de)一種新型服(fu)(fu)務(wu)模(mo)式,具有大規模(mo)、低成本、可(ke)擴展、可(ke)度量及(ji)高(gao)可(ke)靠(kao)性等(deng)特點。它提供(gong)各種計(ji)算(suan)服(fu)(fu)務(wu)的(de)IT資(zi)源(包括網(wang)絡、服(fu)(fu)務(wu)器、存(cun)儲(chu)、應(ying)用軟件、服(fu)(fu)務(wu)等(deng)),按使用量付費(fei),用戶和(he)企業無需關注計(ji)算(suan)服(fu)(fu)務(wu)的(de)實(shi)現過(guo)程,即可(ke)完(wan)成資(zi)源的(de)靈活分配和(he)應(ying)用的(de)快(kuai)速部署(shu)。
一、云計算(suan)產業(ye)鏈結構(gou)
圖1云(yun)計算產(chan)業鏈結構
如(ru)圖(tu)1所示,云(yun)計(ji)算(suan)(suan)產業(ye)(ye)鏈主要(yao)有(you)(you)十大關(guan)鍵(jian)環節(jie),各環節(jie)相(xiang)互協作,組成(cheng)云(yun)計(ji)算(suan)(suan)特有(you)(you)產業(ye)(ye)鏈,云(yun)服(fu)(fu)務(wu)(wu)(wu)(wu)(wu)(資(zi)源(yuan)、應用、平(ping)臺(tai))提(ti)(ti)供(gong)(gong)商(shang)在整個(ge)(ge)云(yun)計(ji)算(suan)(suan)產業(ye)(ye)鏈中占(zhan)據核心地位。云(yun)資(zi)源(yuan)服(fu)(fu)務(wu)(wu)(wu)(wu)(wu)提(ti)(ti)供(gong)(gong)商(shang)在獲得硬件資(zi)源(yuan)后,通過(guo)(guo)云(yun)計(ji)算(suan)(suan)支(zhi)撐軟(ruan)件生成(cheng)資(zi)源(yuan)池,實(shi)現資(zi)源(yuan)動(dong)態(tai)調配,提(ti)(ti)供(gong)(gong)基礎資(zi)源(yuan)服(fu)(fu)務(wu)(wu)(wu)(wu)(wu);云(yun)平(ping)臺(tai)服(fu)(fu)務(wu)(wu)(wu)(wu)(wu)提(ti)(ti)供(gong)(gong)商(shang)提(ti)(ti)供(gong)(gong)云(yun)計(ji)算(suan)(suan)平(ping)臺(tai)服(fu)(fu)務(wu)(wu)(wu)(wu)(wu);云(yun)應用服(fu)(fu)務(wu)(wu)(wu)(wu)(wu)提(ti)(ti)供(gong)(gong)商(shang)提(ti)(ti)供(gong)(gong)豐富(fu)的(de)(de)(de)、個(ge)(ge)性化(hua)的(de)(de)(de)應用。整條(tiao)產業(ye)(ye)鏈上其他各個(ge)(ge)行業(ye)(ye)幾乎都(dou)與這(zhe)三個(ge)(ge)云(yun)計(ji)算(suan)(suan)服(fu)(fu)務(wu)(wu)(wu)(wu)(wu)提(ti)(ti)供(gong)(gong)商(shang)有(you)(you)著緊密的(de)(de)(de)聯系,通過(guo)(guo)網絡服(fu)(fu)務(wu)(wu)(wu)(wu)(wu)商(shang)、終端或是云(yun)平(ping)臺(tai)服(fu)(fu)務(wu)(wu)(wu)(wu)(wu)提(ti)(ti)供(gong)(gong)商(shang)向用戶提(ti)(ti)供(gong)(gong)相(xiang)關(guan)服(fu)(fu)務(wu)(wu)(wu)(wu)(wu)。
在云(yun)服(fu)(fu)(fu)務(wu)提(ti)(ti)供(gong)商中,Amazon 是最早提(ti)(ti)供(gong)云(yun)計(ji)(ji)算(suan)服(fu)(fu)(fu)務(wu)的(de)公司之一,該公司的(de)云(yun)存(cun)儲(chu)服(fu)(fu)(fu)務(wu)(Amazon Simple Storage Service,S3)的(de)采(cai)用(yong)(yong)(yong)(yong)的(de)是Dynamo分布式存(cun)儲(chu)引擎;彈(dan)性計(ji)(ji)算(suan)云(yun)(Elastic Compute Cloud,EC2)服(fu)(fu)(fu)務(wu)則(ze)基于Hadoop計(ji)(ji)算(suan)框架(jia)和(he)虛(xu)擬(ni)化Xen技術,為(wei)用(yong)(yong)(yong)(yong)戶提(ti)(ti)供(gong)按(an)需(xu)分配的(de)“出(chu)租虛(xu)擬(ni)機”服(fu)(fu)(fu)務(wu)。IBM 的(de)“藍云(yun)(blue cloud)”計(ji)(ji)算(suan)平(ping)臺(tai)采(cai)用(yong)(yong)(yong)(yong)了開(kai)源(yuan)的(de)虛(xu)擬(ni)化技術Xen和(he)PowerVM以及開(kai)源(yuan)的(de)Hadoop計(ji)(ji)算(suan)框架(jia),為(wei)客戶提(ti)(ti)供(gong)低成本、易操(cao)作(zuo)的(de)云(yun)計(ji)(ji)算(suan)環境(jing)。Google公司推出(chu)GAE(Google APP Engine)云(yun)計(ji)(ji)算(suan)平(ping)臺(tai),采(cai)用(yong)(yong)(yong)(yong)了GFS(Google File System)、MapReduce、BigTable等分布式數據管理(li)系統,為(wei)用(yong)(yong)(yong)(yong)戶提(ti)(ti)供(gong)一定免費存(cun)儲(chu)空間和(he)流量,以及按(an)使用(yong)(yong)(yong)(yong)付費的(de)增值服(fu)(fu)(fu)務(wu)。而微軟的(de)Windows Azure平(ping)臺(tai)則(ze)提(ti)(ti)供(gong)了一個可擴展的(de)開(kai)發(fa)、托管服(fu)(fu)(fu)務(wu)和(he)服(fu)(fu)(fu)務(wu)管理(li)環境(jing)采(cai)用(yong)(yong)(yong)(yong)了HyperV虛(xu)擬(ni)化技術,并提(ti)(ti)供(gong)對Hadoop的(de)支持。
從云(yun)服(fu)務提(ti)供商的(de)(de)(de)(de)云(yun)平臺(tai)可以看出,云(yun)計(ji)(ji)(ji)算(suan)(suan)(suan)(suan)的(de)(de)(de)(de)關鍵在(zai)于分(fen)(fen)布(bu)式計(ji)(ji)(ji)算(suan)(suan)(suan)(suan)和虛擬化。在(zai)虛擬化和云(yun)計(ji)(ji)(ji)算(suan)(suan)(suan)(suan)共同構成的(de)(de)(de)(de)架構里,虛擬化有(you)效分(fen)(fen)離(li)了(le)硬件(jian)(jian)與軟件(jian)(jian),使人們將精力集中于軟件(jian)(jian)提(ti)供的(de)(de)(de)(de)服(fu)務上,因此(ci),虛擬化為云(yun)計(ji)(ji)(ji)算(suan)(suan)(suan)(suan)提(ti)供了(le)堅定(ding)的(de)(de)(de)(de)基礎。分(fen)(fen)布(bu)式計(ji)(ji)(ji)算(suan)(suan)(suan)(suan)則是云(yun)計(ji)(ji)(ji)算(suan)(suan)(suan)(suan)創造出的(de)(de)(de)(de)一種全(quan)新的(de)(de)(de)(de)計(ji)(ji)(ji)算(suan)(suan)(suan)(suan)模式,用作(zuo)大規模數據處理,它是云(yun)計(ji)(ji)(ji)算(suan)(suan)(suan)(suan)的(de)(de)(de)(de)核心(xin),也是云(yun)計(ji)(ji)(ji)算(suan)(suan)(suan)(suan)的(de)(de)(de)(de)發(fa)展趨勢。Hadoop作(zuo)為分(fen)(fen)布(bu)式計(ji)(ji)(ji)算(suan)(suan)(suan)(suan)的(de)(de)(de)(de)一種開(kai)源軟件(jian)(jian)解決方案,也是當今最熱門的(de)(de)(de)(de)分(fen)(fen)布(bu)式框架,為個人和企業提(ti)供一個可靠、可伸縮、低成本(ben)的(de)(de)(de)(de)云(yun)計(ji)(ji)(ji)算(suan)(suan)(suan)(suan)模式。
開源(yuan)軟件(jian)的(de)低(di)成(cheng)本特(te)性(xing)(xing)可(ke)以(yi)幫助云計(ji)(ji)(ji)算服(fu)務提供商顯著(zhu)地降低(di)開發(fa)、運營、維(wei)護等成(cheng)本,同時保證客戶(hu)自(zi)由使用。云計(ji)(ji)(ji)算服(fu)務繼承了開放源(yuan)碼軟件(jian)產品(pin)免費、服(fu)務收費的(de)商業模式。開源(yuan)技術的(de)開放性(xing)(xing)和(he)兼容性(xing)(xing)能夠(gou)為(wei)云計(ji)(ji)(ji)算提供最強有力的(de)支持。可(ke)以(yi)預計(ji)(ji)(ji),開源(yuan)云計(ji)(ji)(ji)算將成(cheng)為(wei)云計(ji)(ji)(ji)算發(fa)展的(de)一個重(zhong)要方向。
二、Hadoop生態圈(quan)發(fa)展路線分析
傳統(tong)的關(guan)系(xi)型(xing)數據庫(ku)管理(li)(li)系(xi)統(tong)面(mian)對海(hai)量數據處(chu)理(li)(li),逐漸無法勝任當前的需(xu)求。2003年以(yi)來,Google陸續推出了(le)GFS、MapReduce、BigTable(谷(gu)歌“三寶”)等與可(ke)擴(kuo)展、高性能的分布式(shi)數據處(chu)理(li)(li)框架相關(guan)的技術,實現了(le)海(hai)量數據的并行處(chu)理(li)(li),證明了(le)它們在處(chu)理(li)(li)海(hai)量半結構化或非結構化數據的優越性。
圖2 Hadoop生態圈發展路線
如(ru)圖 2所示,Hadoop由Doug Cutting于2004年提出,它的(de)(de)原型和靈感來自于Google的(de)(de)MapReduce和GFS,是開(kai)源的(de)(de)分布式計(ji)算框(kuang)架。2006年,隨(sui)(sui)著(zhu)Doug Cutting 加(jia)入(ru)雅虎,Hadoop項(xiang)(xiang)目從(cong)Nutch(一個(ge)(ge)開(kai)源的(de)(de)網(wang)絡(luo)搜索引擎)項(xiang)(xiang)目中獨立出來,成(cheng)(cheng)為Apache基金會(hui)資(zi)助(zhu)的(de)(de)頂級(ji)項(xiang)(xiang)目。隨(sui)(sui)后,Hadoop經(jing)過七(qi)年積累,融(rong)入(ru)了(le)R語言、Hive、Pig、Zookeeper、Cassandra、Chukwa、Sqoop等一系列數據庫及工具,從(cong)一個(ge)(ge)科學項(xiang)(xiang)目逐漸發展成(cheng)(cheng)一個(ge)(ge)成(cheng)(cheng)熟的(de)(de)主流商業應用。
Hadoop項目的(de)(de)(de)核心是(shi)(shi)HDFS、MapReduce和HBase。HDFS是(shi)(shi)GFS的(de)(de)(de)開(kai)(kai)(kai)源實現(xian),提(ti)供(gong)高(gao)吞(tun)吐(tu)量的(de)(de)(de)可(ke)靠分布(bu)式(shi)(shi)(shi)文件系(xi)統(tong)。MapReduce是(shi)(shi)Google MapReduce的(de)(de)(de)開(kai)(kai)(kai)源實現(xian),提(ti)供(gong)大型分布(bu)式(shi)(shi)(shi)數據(ju)(ju)(ju)處理模型。HBase是(shi)(shi)BigTable的(de)(de)(de)開(kai)(kai)(kai)源實現(xian),提(ti)供(gong)結(jie)構化(hua)數據(ju)(ju)(ju)存(cun)儲的(de)(de)(de)分布(bu)式(shi)(shi)(shi)數據(ju)(ju)(ju)庫。Cassandra提(ti)供(gong)非關(guan)(guan)系(xi)型的(de)(de)(de)分布(bu)式(shi)(shi)(shi)數據(ju)(ju)(ju)庫,是(shi)(shi)Amazon的(de)(de)(de)Dynamo存(cun)儲引擎(qing)和Google的(de)(de)(de)BigTable存(cun)儲數據(ju)(ju)(ju)庫的(de)(de)(de)有機結(jie)合。Hive和Pig與(yu)編程模型有關(guan)(guan),Hive是(shi)(shi)提(ti)供(gong)數據(ju)(ju)(ju)摘要(yao)和查詢功能的(de)(de)(de)數據(ju)(ju)(ju)倉庫,Pig是(shi)(shi)一(yi)種可(ke)以(yi)簡(jian)化(hua)MapReduce任務開(kai)(kai)(kai)發(fa)的(de)(de)(de)數據(ju)(ju)(ju)流語言。Google Chubby很好地解決了分布(bu)式(shi)(shi)(shi)開(kai)(kai)(kai)發(fa)的(de)(de)(de)一(yi)致(zhi)性問題,Zookeeper是(shi)(shi)Chubby的(de)(de)(de)開(kai)(kai)(kai)源實現(xian)。Chukwa是(shi)(shi)大型分布(bu)式(shi)(shi)(shi)數據(ju)(ju)(ju)收集分析系(xi)統(tong),主要(yao)負責將非結(jie)構化(hua)數據(ju)(ju)(ju)轉化(hua)成結(jie)構化(hua)數據(ju)(ju)(ju);Sqoop是(shi)(shi)分布(bu)式(shi)(shi)(shi)數據(ju)(ju)(ju)遷移(yi)工具,主要(yao)負責關(guan)(guan)系(xi)型數據(ju)(ju)(ju)庫與(yu)HDFS、Hive之間數據(ju)(ju)(ju)的(de)(de)(de)傳遞。
Doug Cutting于2009年(nian)離開Yahoo,加盟(meng)初(chu)創公(gong)司(si)Cloudera,它是最(zui)(zui)早將 Hadoop商(shang)用(yong)化(hua)的公(gong)司(si)。如今,Cloudera、2011年(nian)從Yahoo剝(bo)離的Hortonworks、MapR在Hadoop領域形成(cheng)三足鼎立之勢。Hortonworks選擇(ze)與(yu)紅帽、微軟等(deng)公(gong)司(si)聯手,希望(wang)借助開源社區和合(he)作伙(huo)(huo)伴的力(li)量壯(zhuang)大自(zi)己;Cloudera則(ze)與(yu)英(ying)特爾合(he)作,瞄準(zhun)高利潤(run)的大訂單;MapR通過與(yu)EMC達成(cheng)戰(zhan)略(lve)合(he)作伙(huo)(huo)伴,致力(li)于開發下一代(dai)性能強的Hadoop。同時(shi),Zettaset、HStreaming、Hadapt等(deng)與(yu)Hadoop相關的新(xin)(xin)公(gong)司(si)也(ye)獲得投資(zi),為市場(chang)帶(dai)來(lai)最(zui)(zui)新(xin)(xin)技術。
三(san)、云計算相關技術趨勢分析(xi)
圖3 2002-2013年世界云計算相關技術發展趨勢
(2013年數據由于專利公開時間滯(zhi)后導致檢索(suo)到專利申請量下降)
圖3是(shi)近十(shi)年(nian)(nian)(nian)世(shi)界云(yun)計算(suan)所涉專(zhuan)利申請(qing)(qing)的變(bian)化(hua)趨勢(shi)。如圖所示,云(yun)計算(suan)技(ji)(ji)(ji)術約已發(fa)展十(shi)多(duo)年(nian)(nian)(nian)時間(jian),但從2009年(nian)(nian)(nian)開(kai)始(shi)云(yun)計算(suan)所涉專(zhuan)利申請(qing)(qing)量(liang)開(kai)始(shi)出現明(ming)顯的增幅(fu),尤其是(shi)數據存(cun)儲和數據管理(li)技(ji)(ji)(ji)術,專(zhuan)利申請(qing)(qing)量(liang)在(zai)2012年(nian)(nian)(nian)分(fen)別達到了1800和1500多(duo)件,這兩個技(ji)(ji)(ji)術現已成為最熱點(dian)的技(ji)(ji)(ji)術。云(yun)安全技(ji)(ji)(ji)術的發(fa)展也(ye)較為迅速,其專(zhuan)利申請(qing)(qing)量(liang)也(ye)呈(cheng)現出明(ming)顯的增長趨勢(shi)。平(ping)(ping)臺管理(li)技(ji)(ji)(ji)術的專(zhuan)利申請(qing)(qing)量(liang)也(ye)在(zai)逐年(nian)(nian)(nian)增多(duo),而編程模型技(ji)(ji)(ji)術處于平(ping)(ping)穩發(fa)展階(jie)段(duan),每年(nian)(nian)(nian)專(zhuan)利申請(qing)(qing)量(liang)基本持平(ping)(ping)。
圖4中國(guo)云計算(suan)相關(guan)技術發展趨(qu)勢(shi)
(2013年(nian)數據由于專利公(gong)開時間滯后導(dao)致檢(jian)索到專利申請(qing)量(liang)下(xia)降(jiang))
如圖4所(suo)示(shi),2009年(nian)(nian)之前,我國的(de)(de)云(yun)(yun)(yun)計算技(ji)術(shu)處(chu)于起步(bu)階段,專利(li)(li)申(shen)請(qing)(qing)呈現緩慢(man)增(zeng)長趨(qu)(qu)勢(shi)(shi)。從2010年(nian)(nian)開始(shi),各項(xiang)技(ji)術(shu)加(jia)快發(fa)展(zhan)步(bu)伐,其(qi)中(zhong)數據存儲(chu)和數據管理(li)(li)技(ji)術(shu)發(fa)展(zhan)最(zui)快,在(zai)2012年(nian)(nian)的(de)(de)專利(li)(li)申(shen)請(qing)(qing)量(liang)均達到800多件,說明國內(nei)各大(da)企(qi)業(ye)和研究機構(gou)非(fei)常看好(hao)這兩項(xiang)技(ji)術(shu)的(de)(de)發(fa)展(zhan)。緊隨其(qi)后的(de)(de)是(shi)云(yun)(yun)(yun)安全,其(qi)申(shen)請(qing)(qing)量(liang)在(zai)2012年(nian)(nian)達到了(le)(le)500多件,也成為(wei)了(le)(le)關注的(de)(de)重點(dian)。云(yun)(yun)(yun)平臺管理(li)(li)技(ji)術(shu)專利(li)(li)申(shen)請(qing)(qing)量(liang)雖不及其(qi)他(ta)技(ji)術(shu)那樣增(zeng)速顯著,但(dan)是(shi)它一直保(bao)持(chi)著良(liang)好(hao)的(de)(de)發(fa)展(zhan)勢(shi)(shi)頭。編程模型所(suo)涉(she)專利(li)(li)申(shen)請(qing)(qing)量(liang)在(zai)經過2011年(nian)(nian)的(de)(de)高(gao)峰后出現下滑趨(qu)(qu)勢(shi)(shi)。總體(ti)來講,我國的(de)(de)云(yun)(yun)(yun)計算技(ji)術(shu)發(fa)展(zhan)趨(qu)(qu)勢(shi)(shi)與(yu)世界趨(qu)(qu)勢(shi)(shi)保(bao)持(chi)一致。
從(cong)云計(ji)算技術的(de)(de)發展(zhan)趨勢中不難(nan)看出,數(shu)據(ju)(ju)(ju)存(cun)儲和數(shu)據(ju)(ju)(ju)管理技術發展(zhan)最為迅(xun)速,都已成(cheng)為熱點技術。就這兩個技術而(er)言(yan),數(shu)據(ju)(ju)(ju)存(cun)儲技術是(shi)利用分布式存(cun)儲的(de)(de)方式對海量的(de)(de)數(shu)據(ju)(ju)(ju)進行(xing)(xing)存(cun)儲,將其(qi)放(fang)入Bigtable、HBase、Cassandra等(deng)數(shu)據(ju)(ju)(ju)庫中;數(shu)據(ju)(ju)(ju)管理技術則是(shi)對數(shu)據(ju)(ju)(ju)庫中的(de)(de)大數(shu)據(ju)(ju)(ju)集進行(xing)(xing)處理、分析,高(gao)效的(de)(de)管理,所以說數(shu)據(ju)(ju)(ju)存(cun)儲是(shi)數(shu)據(ju)(ju)(ju)管理的(de)(de)基(ji)礎與前(qian)提。云存(cun)儲作為云計(ji)算服務的(de)(de)一(yi)項重要組成(cheng)部分,也是(shi)增長速度最快的(de)(de)云計(ji)算服務。
四、數據存儲技(ji)術專利分析
圖52003-2013年(nian)數(shu)據(ju)存(cun)儲技術所涉專利申請量(liang)(優先權年(nian))
(2013年數據(ju)由于專(zhuan)(zhuan)利公開時間滯后導(dao)致檢索到專(zhuan)(zhuan)利申請量(liang)下(xia)降)
如圖5所示,數(shu)據(ju)存(cun)儲技(ji)(ji)術(shu)(shu)已發展十(shi)多年時間,起(qi)初(chu)幾年發展相(xiang)對緩慢,從2009年開始申請數(shu)量上開始出(chu)現明顯(xian)的(de)(de)增幅(fu)。從2009年到2011年,這個(ge)階(jie)段數(shu)據(ju)存(cun)儲技(ji)(ji)術(shu)(shu)的(de)(de)專利(li)申請量每年翻(fan)一番,2012年專利(li)量仍然保持著上升(sheng)勢頭,達到1600多件,可見數(shu)據(ju)存(cun)儲技(ji)(ji)術(shu)(shu)處在(zai)技(ji)(ji)術(shu)(shu)快速成長期,仍存(cun)在(zai)著很大(da)的(de)(de)發展潛力(li)。
從數(shu)據(ju)存儲(chu)(chu)技(ji)術(shu)(shu)(shu)專利首次申請國(guo)(guo)(guo)(guo)家(jia)和(he)地區的(de)比例來看,中國(guo)(guo)(guo)(guo)的(de)申請量(liang)已居全(quan)球首位,達到40%的(de)份(fen)額。以阿里云(yun)、奇虎、盛大(da)(da)、浪(lang)潮等為代表的(de)公(gong)司正在(zai)加大(da)(da)研發的(de)力度(du),另有(you)國(guo)(guo)(guo)(guo)際巨頭在(zai)華落(luo)地,擴大(da)(da)中國(guo)(guo)(guo)(guo)市場,使得中國(guo)(guo)(guo)(guo)區域的(de)數(shu)據(ju)存儲(chu)(chu)技(ji)術(shu)(shu)(shu)的(de)專利驟增(zeng)。美(mei)國(guo)(guo)(guo)(guo)的(de)申請量(liang)僅次于中國(guo)(guo)(guo)(guo),占到全(quan)球份(fen)額的(de)37%。美(mei)國(guo)(guo)(guo)(guo)擁有(you)技(ji)術(shu)(shu)(shu)實力強大(da)(da)的(de)雅虎、IBM、微軟(ruan)、Salesforce(軟(ruan)營(ying))、Google以及Facebook等公(gong)司,因此在(zai)技(ji)術(shu)(shu)(shu)上(shang),仍然占據(ju)主(zhu)(zhu)導地位。韓(han)國(guo)(guo)(guo)(guo)和(he)日本也在(zai)加大(da)(da)發展勢頭,他們的(de)申請量(liang)占到了全(quan)球的(de)8%和(he)4%,總體上(shang)講中國(guo)(guo)(guo)(guo)和(he)美(mei)國(guo)(guo)(guo)(guo)是(shi)數(shu)據(ju)存儲(chu)(chu)技(ji)術(shu)(shu)(shu)的(de)主(zhu)(zhu)要來源國(guo)(guo)(guo)(guo)家(jia)。
圖7是(shi)數據存儲技(ji)術(shu)專利申請量的國(guo)(guo)家分(fen)布地(di)圖。從圖中(zhong)(zhong)可以看出,數據存儲技(ji)術(shu)專利申請量最多(duo)的國(guo)(guo)家是(shi)中(zhong)(zhong)國(guo)(guo)和美(mei)國(guo)(guo)。對于中(zhong)(zhong)國(guo)(guo),一方面(mian)(mian)由于國(guo)(guo)家對云計(ji)算發展(zhan)的重(zhong)視并給予大(da)(da)(da)力支持,另有阿里云、盛大(da)(da)(da)、浪潮等(deng)公(gong)司(si)在(zai)(zai)數據存儲技(ji)術(shu)上(shang)研發迅猛,顯示了(le)強大(da)(da)(da)的研發實(shi)力。此(ci)(ci)外中(zhong)(zhong)國(guo)(guo)是(shi)世界上(shang)較(jiao)大(da)(da)(da)的云計(ji)算市場(chang),是(shi)各個公(gong)司(si)的必爭之地(di),國(guo)(guo)際巨(ju)頭也(ye)紛紛落地(di)中(zhong)(zhong)國(guo)(guo),因此(ci)(ci)在(zai)(zai)中(zhong)(zhong)國(guo)(guo)的專利布局(ju)較(jiao)多(duo)。而對于美(mei)國(guo)(guo),一方面(mian)(mian)由于美(mei)國(guo)(guo)擁(yong)有以雅虎、微軟、google、IBM等(deng)為代表的公(gong)司(si),所以在(zai)(zai)技(ji)術(shu)上(shang)占有絕對優勢(shi),另一方面(mian)(mian)巨(ju)大(da)(da)(da)的云計(ji)算市場(chang)也(ye)是(shi)其爭先進(jin)行(xing)專利布局(ju)的原因。
韓(han)國(guo)(guo)、日(ri)本(ben)在數(shu)(shu)據存儲(chu)技術(shu)(shu)專利(li)的(de)(de)申請量(liang)上屬于(yu)(yu)第二梯隊,其中韓(han)國(guo)(guo)實力不容(rong)小覷,其以三星、韓(han)國(guo)(guo)電子研(yan)究院、SK公司(si)、韓(han)國(guo)(guo)電信為代(dai)表的(de)(de)企(qi)業一直擁有優勢,并(bing)也(ye)在數(shu)(shu)據存儲(chu)技術(shu)(shu)上不斷加(jia)大(da)研(yan)發(fa)投入,取得(de)了較大(da)的(de)(de)發(fa)展,同時也(ye)進一步擴(kuo)大(da)了市場。日(ri)本(ben)也(ye)處于(yu)(yu)發(fa)展期(qi),正(zheng)在加(jia)大(da)對數(shu)(shu)據存儲(chu)技術(shu)(shu)的(de)(de)開發(fa)及專利(li)布(bu)局。
英國(guo)(guo)、歐盟、印度(du)、中(zhong)國(guo)(guo)臺灣處在第三梯隊,他(ta)們的專利(li)申請量(liang)要(yao)少于中(zhong)國(guo)(guo)、美國(guo)(guo)、日本及韓國(guo)(guo)。綜上可見,中(zhong)國(guo)(guo)和美國(guo)(guo)占(zhan)據(ju)了大部分數據(ju)存儲(chu)技術(shu)專利(li)申請量(liang)份額,這(zhe)兩個國(guo)(guo)家對數據(ju)存儲(chu)技術(shu)的發展和全球市場有著(zhu)巨大的影(ying)響力(li)。
圖8 2005-2014年中美數據存(cun)儲技術專利授(shou)權情況
(2014年數(shu)據由于(yu)專利(li)公開時(shi)間滯后導致檢索到專利(li)授權(quan)量下降)
如(ru)圖8所(suo)示,從中(zhong)美兩國(guo)(guo)(guo)(guo)(guo)的(de)(de)(de)數(shu)據(ju)存(cun)(cun)儲(chu)技(ji)術(shu)(shu)專利授(shou)權量(liang)來看,2005年至(zhi)2010年,這一時期數(shu)據(ju)存(cun)(cun)儲(chu)技(ji)術(shu)(shu)尚(shang)處于(yu)起步階段(duan)。從2011年開始兩國(guo)(guo)(guo)(guo)(guo)的(de)(de)(de)數(shu)據(ju)存(cun)(cun)儲(chu)技(ji)術(shu)(shu)專利授(shou)權量(liang)快速增(zeng)加,其(qi)中(zhong)美國(guo)(guo)(guo)(guo)(guo)的(de)(de)(de)年授(shou)權量(liang)遠多于(yu)中(zhong)國(guo)(guo)(guo)(guo)(guo),說明美國(guo)(guo)(guo)(guo)(guo)在關鍵技(ji)術(shu)(shu)上(shang)具(ju)有很大的(de)(de)(de)優勢,我國(guo)(guo)(guo)(guo)(guo)與(yu)美國(guo)(guo)(guo)(guo)(guo)還有很大的(de)(de)(de)差距。但是我國(guo)(guo)(guo)(guo)(guo)的(de)(de)(de)專利授(shou)權量(liang)的(de)(de)(de)增(zeng)長速度(du)也十分迅猛,這是由于(yu)我國(guo)(guo)(guo)(guo)(guo)對發展數(shu)據(ju)存(cun)(cun)儲(chu)技(ji)術(shu)(shu)較為重視,加之(zhi)擁(yong)有較大的(de)(de)(de)市場潛力,未來我國(guo)(guo)(guo)(guo)(guo)的(de)(de)(de)數(shu)據(ju)存(cun)(cun)儲(chu)技(ji)術(shu)(shu)專利授(shou)權量(liang)仍會(hui)保持(chi)增(zeng)長趨勢。
圖(tu)9數據存儲專利申請的主要專利權人(ren)(2003-2013年)
圖9為(wei)數(shu)據存儲技(ji)(ji)(ji)術主要(yao)專(zhuan)利權(quan)人的(de)(de)(de)專(zhuan)利申請量(liang)(liang),從圖中可(ke)以看出(chu),美國的(de)(de)(de)IBM和微軟(ruan)是數(shu)據存儲技(ji)(ji)(ji)術專(zhuan)利擁有量(liang)(liang)最多的(de)(de)(de)兩個公司。IBM和微軟(ruan),全球領先的(de)(de)(de)云(yun)服(fu)務提供商,都十分重視專(zhuan)利的(de)(de)(de)布局(ju),他們在數(shu)據存儲技(ji)(ji)(ji)術上的(de)(de)(de)專(zhuan)利布局(ju)已經處于領先地位。
Li Z(個人)的(de)(de)(de)專利達到(dao)了110余件(jian)(jian),位(wei)列第三;中(zhong)國(guo)(guo)的(de)(de)(de)浪潮(chao)也(ye)在(zai)(zai)(zai)數(shu)(shu)據(ju)存(cun)儲(chu)(chu)技(ji)術上有較好的(de)(de)(de)表(biao)現,擁有70多件(jian)(jian)數(shu)(shu)據(ju)存(cun)儲(chu)(chu)技(ji)術專利。在(zai)(zai)(zai)排名(ming)前十五的(de)(de)(de)企(qi)業中(zhong),中(zhong)國(guo)(guo)的(de)(de)(de)企(qi)業還有中(zhong)興、上海博(bo)路(lu)信(xin)息(xi)、奇虎、華為。韓國(guo)(guo)的(de)(de)(de)企(qi)業包括SK電(dian)訊、韓國(guo)(guo)電(dian)子通信(xin)研究院,他們也(ye)都在(zai)(zai)(zai)積極(ji)的(de)(de)(de)布局數(shu)(shu)據(ju)存(cun)儲(chu)(chu)技(ji)術的(de)(de)(de)專利。
圖10數據存儲專(zhuan)利申請的主要發明人(2003-2013年(nian))
如圖(tu)10所(suo)示,ZHANG X、WANG Y、LI Y、CHEN Y等主要與IBM公(gong)司進(jin)行合(he)作(zuo)(zuo)(zuo)。LI Z(大多(duo)(duo)專(zhuan)利(li)自己作(zuo)(zuo)(zuo)為專(zhuan)利(li)權人)、WANG J、WANG Y、LI Y與微軟公(gong)司保(bao)(bao)持良好的合(he)作(zuo)(zuo)(zuo)關系(xi),同時,WANG J、WANG Y、LI Y與上海博(bo)路信息有合(he)作(zuo)(zuo)(zuo)。ZHANG J和LI X均(jun)與多(duo)(duo)家(jia)公(gong)司保(bao)(bao)持密切的合(he)作(zuo)(zuo)(zuo)。LIU H 服務于奇虎公(gong)司,其發(fa)明專(zhuan)利(li)均(jun)為奇虎公(gong)司所(suo)有。總體上看(kan),基(ji)本多(duo)(duo)家(jia)公(gong)司都與主要發(fa)明人保(bao)(bao)持合(he)作(zuo)(zuo)(zuo)關系(xi),共(gong)同推動數據存儲技術的發(fa)展。
圖112003-2013年數據存儲(chu)技術的(de)IPC變(bian)化情況
(2013年數據由于專利(li)公(gong)開時間滯后導(dao)致(zhi)檢索(suo)到專利(li)申請量(liang)下降)
(注:圖(tu)中分類號含義(yi)分別(bie)為:G06F 電(dian)數(shu)字數(shu)據(ju)處理;H04L 數(shu)字信(xin)息傳(chuan)輸;G06Q 數(shu)據(ju)處理系統(tong)(tong)或(huo)方(fang)法;H04N 圖(tu)像通(tong)信(xin),如電(dian)視等;H04W 無線網絡通(tong)信(xin);G06K 數(shu)據(ju)識(shi)別(bie)、數(shu)據(ju)表示(shi)、記錄載(zai)體;G05B 控(kong)制或(huo)調節系統(tong)(tong);H04M 電(dian)話通(tong)信(xin);G06T 圖(tu)像數(shu)據(ju)處理或(huo)產生;H04B 傳(chuan)輸)
對歷年數(shu)(shu)(shu)據(ju)(ju)(ju)存(cun)儲(chu)(chu)技(ji)(ji)術(shu)涉及(ji)的(de)IPC變化(hua)情況進行分(fen)析(xi),如圖11所(suo)示,從(cong)2003年至2008年,數(shu)(shu)(shu)據(ju)(ju)(ju)存(cun)儲(chu)(chu)的(de)專利(li)申請處(chu)于(yu)初始階段。從(cong)2009年開始,數(shu)(shu)(shu)據(ju)(ju)(ju)存(cun)儲(chu)(chu)技(ji)(ji)術(shu)進入(ru)發展(zhan)時期,專利(li)申請主要(yao)布局在(zai)G06F、H04L、G06Q以及(ji)H04N。其中技(ji)(ji)術(shu)G06F及(ji)H04L占的(de)比例最(zui)高,G06F為電數(shu)(shu)(shu)字數(shu)(shu)(shu)據(ju)(ju)(ju)處(chu)理(li)(li),大部分(fen)專利(li)涉及(ji)檔案的(de)管理(li)(li)、分(fen)享、備份(fen)等技(ji)(ji)術(shu)內容,而H04L為數(shu)(shu)(shu)字信(xin)息的(de)傳輸,大部分(fen)的(de)專利(li)涉及(ji)到檔案的(de)傳輸技(ji)(ji)術(shu)及(ji)傳輸技(ji)(ji)術(shu)的(de)應用。其次數(shu)(shu)(shu)據(ju)(ju)(ju)存(cun)儲(chu)(chu)在(zai)數(shu)(shu)(shu)據(ju)(ju)(ju)處(chu)理(li)(li)及(ji)圖像通信(xin)方面(mian)(G06Q、H04N)也占據(ju)(ju)(ju)著較(jiao)大的(de)比例,這(zhe)也是數(shu)(shu)(shu)據(ju)(ju)(ju)存(cun)儲(chu)(chu)需要(yao)重(zhong)點關注的(de)方面(mian)。數(shu)(shu)(shu)據(ju)(ju)(ju)存(cun)儲(chu)(chu)在(zai)H04W、G06K、G05B上也有一定的(de)布局,但是總(zong)體數(shu)(shu)(shu)量較(jiao)少。
圖12近5年數(shu)據(ju)存(cun)儲技術的研究熱(re)點(2009-2014年)
對專利(li)的(de)熱(re)力(li)圖進行分析,我們可(ke)以(yi)看(kan)到(dao)專利(li)涉及(ji)虛擬環境、服務(wu)器信(xin)息、模(mo)塊(kuai)連接、文件信(xin)息存儲等多(duo)(duo)種領域。熱(re)點(dian)技術包括(kuo)存儲虛擬化、自動分層存儲、重復數(shu)據刪除及(ji)數(shu)據壓縮。眾所周知,云計算(suan)(suan)采用分布式(shi)存儲的(de)方式(shi)來(lai)存儲數(shu)據,采用冗余存儲的(de)方式(shi)來(lai)保證存儲數(shu)據的(de)可(ke)靠性(xing),即為(wei)同一份數(shu)據存儲多(duo)(duo)個副(fu)本。另外,云計算(suan)(suan)的(de)數(shu)據存儲技術還具有高(gao)吞吐率和高(gao)傳輸率的(de)特點(dian)。所以(yi)說(shuo)這些熱(re)點(dian)技術的(de)發展和應(ying)用能夠提高(gao)數(shu)據存儲技術性(xing)能,是數(shu)據存儲發展關注(zhu)的(de)重點(dian)。
圖(tu)13數據存儲技術(shu)研究熱(re)點(關鍵(jian)技術(shu))的專利布(bu)局(2003-2013年)
如圖13所示(shi),存(cun)儲虛擬化是數據存(cun)儲的(de)(de)研(yan)究(jiu)熱點,IBM公(gong)司在(zai)(zai)存(cun)儲虛擬化技術(shu)上(shang)占(zhan)有絕對(dui)的(de)(de)優勢;微(wei)軟(ruan)僅次于IBM,在(zai)(zai)存(cun)儲虛擬化技術(shu)上(shang)也(ye)保(bao)持領(ling)先(xian)地位。LI Z(個(ge)(ge)人(ren))、FERRIS J M(個(ge)(ge)人(ren))、韓國電子(zi)通信研(yan)究(jiu)院、華為及(ji)中(zhong)興等專(zhuan)利(li)(li)權(quan)人(ren)也(ye)在(zai)(zai)積極(ji)地進行專(zhuan)利(li)(li)布局。在(zai)(zai)重復數據刪除技術(shu)上(shang),IBM、微(wei)軟(ruan)及(ji)浪(lang)潮公(gong)司的(de)(de)專(zhuan)利(li)(li)布局保(bao)持著比較均(jun)衡的(de)(de)態勢,中(zhong)興和奇虎緊隨其后(hou),也(ye)在(zai)(zai)加緊布局。自動分(fen)層存(cun)儲技術(shu)的(de)(de)專(zhuan)利(li)(li)布局較少,其主要專(zhuan)利(li)(li)權(quan)人(ren)為LI Z(個(ge)(ge)人(ren)),在(zai)(zai)技術(shu)上(shang)相對(dui)領(ling)先(xian),微(wei)軟(ruan)、浪(lang)潮、谷歌、上(shang)海博(bo)路信息和韓國電子(zi)通信研(yan)究(jiu)院的(de)(de)專(zhuan)利(li)(li)布局相對(dui)均(jun)衡。在(zai)(zai)數據壓縮技術(shu)(ICIC)上(shang),主要專(zhuan)利(li)(li)權(quan)人(ren)的(de)(de)專(zhuan)利(li)(li)布局也(ye)較少,IBM、微(wei)軟(ruan)及(ji)LI Z(個(ge)(ge)人(ren))在(zai)(zai)該領(ling)域(yu)保(bao)持著領(ling)先(xian)優勢,占(zhan)據著主導地位。
圖14 2010-2013年數(shu)據存(cun)儲技術熱點的生命周期
對于(yu)一種技術(shu)而言,其生命周(zhou)期分為起步(bu),成(cheng)長(chang)(chang),成(cheng)熟和(he)衰(shuai)退四個階(jie)段。如圖14所示,2009年之前(qian),數(shu)(shu)據(ju)(ju)存儲技術(shu)處于(yu)起步(bu)期,從(cong)2010年開始存儲虛擬(ni)化和(he)重復(fu)數(shu)(shu)據(ju)(ju)刪(shan)除技術(shu)取得(de)突破(po),高速發(fa)展,專(zhuan)利權(quan)人迅速增加,專(zhuan)利申請量也在不斷增多。其中重復(fu)數(shu)(shu)據(ju)(ju)刪(shan)除技術(shu)發(fa)展勢頭(tou)在近兩年開始趕超存儲虛擬(ni)化技術(shu)。至今兩項技術(shu)仍處在技術(shu)的(de)成(cheng)長(chang)(chang)期,仍有較大(da)的(de)發(fa)展潛力。
圖15數據存儲技術主要專利權(quan)人(前15)的合(he)作(zuo)關系(2003-2013年)
從(cong)數(shu)據(ju)存儲主要專利(li)權(quan)人(ren)(ren)的合(he)(he)作(zuo)關(guan)系(xi)(xi)來看(kan),FERRIS J M(個(ge)(ge)人(ren)(ren))、紅帽和RIVEROS GE(個(ge)(ge)人(ren)(ren))關(guan)系(xi)(xi)密切存在合(he)(he)作(zuo)關(guan)系(xi)(xi),深圳先進技術研究院與(yu)中興存在合(he)(he)作(zuo),SK Planet是從(cong)SK電訊中分出來的子公司(si),專利(li)共享。IBM、微軟、LI Z(個(ge)(ge)人(ren)(ren))浪潮、上海博(bo)路信(xin)息、華(hua)為(wei)、三星、奇虎、谷歌等公司(si)在數(shu)據(ju)存儲技術上都沒有開展合(he)(he)作(zuo),各自發展。
總(zong)體上(shang)看,在數據存儲技術中,各(ge)大公(gong)司(si)(si)尚未開展深入的(de)技術合作,一定程度(du)上(shang)是(shi)因(yin)為各(ge)個(ge)公(gong)司(si)(si)都(dou)有自己擅長(chang)的(de)領(ling)域(yu)并占有優勢,以此為基礎(chu)進行獨立(li)研(yan)發。
五、結束語
云(yun)計算(suan)是(shi)隨(sui)著多核處理(li)器、虛擬化、分(fen)(fen)布式存儲(chu)、寬帶互聯網和自動化管(guan)理(li)等(deng)技(ji)(ji)術(shu)(shu)的(de)(de)(de)發(fa)展而產(chan)生了一種(zhong)新型的(de)(de)(de)計算(suan)模式。這種(zhong)計算(suan)模式的(de)(de)(de)總體思想是(shi)通過網絡將龐大的(de)(de)(de)計算(suan)處理(li)程(cheng)序自動拆分(fen)(fen)成無數(shu)較小的(de)(de)(de)程(cheng)序,利(li)用多臺服(fu)務器的(de)(de)(de)資源進行處理(li),最后匯總。其(qi)中,Hadoop是(shi)當前云(yun)計算(suan)相關技(ji)(ji)術(shu)(shu)中最熱門的(de)(de)(de)分(fen)(fen)布式應用開源軟(ruan)件框架。通過對云(yun)計算(suan)專(zhuan)(zhuan)利(li)的(de)(de)(de)分(fen)(fen)析,可以(yi)看(kan)出數(shu)據(ju)存儲(chu)技(ji)(ji)術(shu)(shu)是(shi)當下十分(fen)(fen)熱門的(de)(de)(de)技(ji)(ji)術(shu)(shu),由(you)于(yu)云(yun)存儲(chu)服(fu)務的(de)(de)(de)迅(xun)速普(pu)及,數(shu)據(ju)存儲(chu)技(ji)(ji)術(shu)(shu)專(zhuan)(zhuan)利(li)申請量每年都在急速增(zeng)長(chang)。
從世界(jie)分(fen)布(bu)來看(kan),各(ge)國在數據(ju)(ju)存(cun)儲(chu)技(ji)術上的發(fa)展(zhan)并(bing)不均衡(heng),美(mei)國和中(zhong)國處(chu)于(yu)領(ling)先地位。全(quan)球數據(ju)(ju)存(cun)儲(chu)技(ji)術主(zhu)要(yao)分(fen)布(bu)在IBM、微軟、Li Z(個人(ren))、浪潮、SK電訊、谷歌、上海(hai)博(bo)路信(xin)息、中(zhong)興(xing)等公司(si)和個人(ren)手中(zhong)。從行業關系角度來看(kan),各(ge)大公司(si)尚未(wei)在數據(ju)(ju)存(cun)儲(chu)技(ji)術中(zhong)開展(zhan)深入的技(ji)術合(he)作,都(dou)在自己擅長的領(ling)域獨立研(yan)發(fa)。
以(yi)存(cun)儲虛擬化、重復(fu)數(shu)據(ju)(ju)(ju)(ju)刪除為代表的數(shu)據(ju)(ju)(ju)(ju)存(cun)儲技(ji)術(shu)發展(zhan)(zhan)日趨成熟,隨著商(shang)用化的到(dao)來,各大公司將(jiang)面臨(lin)更加(jia)激烈的競爭,數(shu)據(ju)(ju)(ju)(ju)存(cun)儲技(ji)術(shu)專利將(jiang)是市場(chang)競爭的利器,關乎企業的發展(zhan)(zhan)和競爭地位。隨著技(ji)術(shu)的革新,數(shu)據(ju)(ju)(ju)(ju)存(cun)儲相關專利也將(jiang)向著高速、穩定、安全的方向發展(zhan)(zhan)。
本報告(gao)所作(zuo)(zuo)的(de)專(zhuan)利分析工作(zuo)(zuo)以(yi)THOMSON INNOVATION(湯森路透專(zhuan)利數據庫)中獲得的(de)專(zhuan)利文獻(xian)數據為依托,并參(can)考專(zhuan)家調研信(xin)息,綜合運用了定(ding)量分析和(he)定(ding)性分析方法。
附:云計(ji)算(suan)技術(shu)標準(zhun)及(ji)聯(lian)盟
表1云(yun)計算(suan)技術標(biao)準聯盟(meng)