文獻標識碼: A
文章編號: 0258-7998(2015)03-0012-05
0 引言
隨著移動互聯網、云計算、物聯網等的快速發展及視頻監控、智能終端、應用商店等的快速普及,移動數據量出現爆炸式增長。數據也在潛移默化地影響著人們的生活,2013年移動用戶月均流量:全球529 MB,年增50%;中國139.4 MB,年增42%;預計2020年,全球5.3 GB,中國4.9 GB。淘寶每天交易超過數千萬筆,其單日數據產生量超過50 TB。百度每天要處理60億次搜索請求(谷歌為30億次),新增800 TB,處理100 PB數據,每天產生1 PB的日志,目前存儲網頁數達到1萬億,數據總量達到EB級別。2014年6月騰訊QQ月活躍用戶8.29億,微信活躍用戶4.38億,日新增200~300 TB數據量,每月增加10%。截止到2014年6月,中國網民達6.33億,龐大的網民每時每刻產生大量的數據。在此背景下,大數據時代(Big Data Era)將會面臨新的挑戰。
一般來說,大數據指的是無法在可容忍的時間內采用傳統的IT技術和軟硬件工具對其進行感知、獲取、處理和服務的數據集合,其特點可以總結為4個V,即Volume(數據量大)、Variety(類型繁多)、Velocity(產生速度極快)和Veracity(數據真實)。學術界、工業界甚至于政府機構都已經開始密切關注大數據問題?!禢ature》和《Science》分別在2008年和2011年推出了關于大數據的??痆1-2],2012年,計算社區聯盟發表了報告“Big data computing:Creating revolutionary breakthroughs in commerce,science,and society”[3],旨在闡述數據驅動的背景下,解決大數據問題所需要的技術以及面臨的一些挑戰。奧巴馬政府已把“大數據”上升到國家戰略層面,2012年3月美國投資2億美元啟動“大數據研究和發展計劃”,借以增強收集海量數據、分析萃取信息的能力[4]。歐盟方面,過去幾年已對科學數據基礎設施投資1億多歐元,并將數據信息化基礎設施作為Horizon 2020計劃的優先領域之一。2012年1月截止的預算為5 000萬歐元的FP7 Call 8專門征集針對大數據的研究項目,仍以基礎設施為先導[5]。
物聯網[6]作為大數據業務的重要組成部分,其技術實現問題關系到大數據問題能否順利解決。物聯網的關鍵在于實現世界上所有的人和物在任何時間、任何地點,都能方便地實現人到人(Human-to-Human,H2H)、人到物(Human-to-Machine,H2M)、物到物(Machine-to-Machine,M2M)之間的信息交互。因而物聯網實際上要解決的是海量無線終端的通信問題。
在移動蜂窩網絡是當前主流無線通信網絡的環境下,隨著物聯網、移動互聯網等業務的快速發展,移動蜂窩網絡由于其具有的移動性支持和廣域覆蓋等特性,已成為支撐物聯網、移動互聯網業務有效傳輸的重要途徑。然而傳統移動通信網絡是針對人與人通信業務設計的,而在物聯網通信中,無論是通信數據總量還是無線通信終端設備規模都將空前巨大[7]。以M2M通信為例,據估計未來十年內增加的M2M通信設備將達到240億~500億[8,9],其中將有20億將直接與基站聯系。顯然,大數據無線傳輸將會對原有蜂窩網絡架構、協議、接入控制、資源分配、反饋機制等[10]帶來新的挑戰。
1 大數據無線通信面臨的挑戰
1.1 能量有效問題
現代移動蜂窩網絡設計,包括第四代移動通信系統,如:LTE(Long Term Evolution)[11],其服務對象主要是H2H通信,因此其設計的主要關切是如何提供高的頻譜利用率和高服務質量等。與傳統蜂窩網絡注重提高服務質量和高效利用帶寬不同,物聯網的許多應用環境中難以做到人工干預[12-14],僅僅依靠電池供應能量且電池部署數目龐大,而商品化的電池并不能滿足節點持續工作數月甚至數年的需求,這將使得節點極易因能量耗盡而無法工作,尤其體現在小區邊緣設備首先能量耗盡,從而造成網絡拓撲的變化和網絡性能的惡化,最終導致網絡分裂和癱瘓。因此,無線終端設備更在意如何以盡可能少的能量上傳更多的數據,能量有效問題已成為大數據無線通信系統設計中不可忽略的一個因素[15-17]。
在無線設備的能量消耗中,傳輸信息所需要的能耗遠高于計算所帶來的能耗,如文獻[18]中的收發信機發送1 bit數據耗能1 μJ,接收1 bit數據耗能0.5 μJ,而處理1條指令耗能8 nJ。隨著目前應用需求的不斷豐富,對無線傳感器網絡的能耗要求將更高。如何在網絡運行過程中節約能量、最大化網絡生命周期,是當前面臨的首要挑戰。
1.2 大規模接入控制與資源分配
與H2H通信相比,M2M通信具有很多特點:(1)M2M用戶設備要遠遠多于H2H通信;(2)與H2H通信中用戶通常具有低速甚至高速移動性不同的是,M2M用戶通常具有較低的移動性;(3)大多數M2M上行通信鏈路都采用小數據包傳輸(例如,家庭安全和智能計量服務)。M2M通信的這些特性會給傳統的蜂窩無線通信系統的接入控制和資源分配帶來諸多問題。例如,大量的M2M設備同時發送信息不僅會導致同一小區內隨機接入數據包的擁塞問題,還會干擾相鄰小區的設備?,F有的研究表明[19,20],如果不對大規模接入(Massive Access Control,MAC)和無線資源進行有效管理與控制,大量M2M設備的上行數據量會造成無線資源的嚴重短缺。因此,為了支持M2M通信,傳統的無線通信系統需要一個有效的大規模接入控制和無線資源分配方案。
在M2M/H2H共存的蜂窩網絡通信場景中,一方面,時間、頻率資源的共享會帶來嚴重的同頻干擾,從而大大降低系統性能;另一方面,M2M設備和H2H設備具有不同的服務質量(Quality of Service,QoS)需求。因此,在M2M/H2H共存的蜂窩網絡中,如何在確保各種時延敏感業務(如H2H多媒體通信)QoS的前提下進行有效的接入控制和無線資源分配[21]是一個亟需解決的關鍵問題。傳統的資源分配算法主要用來保證H2H通信的吞吐量最大化、時延最小化[22-24],而M2M通信的群組通信、時延可控、延時容忍、低移動性、小數據傳輸以及低數據速率等特點也給接入控制和無線資源分配提出了新的要求。因此,在設計無線資源分配方案時,需要考慮這兩種類型用戶共存場景下如何進行有效的資源分配[25]。目前,如何針對大規模的無線設備設計合理的大規模接入控制與資源分配方式,提高網絡負載能力,是大數據無線通信面臨的重要挑戰之一。
1.3 “反饋風暴”問題
在M2M網絡中,數據廣播通信由于其較高的頻譜利用率,通常被應用于固件更新、配置設定等場景中。由于無線鏈路的隨機衰落特性,基站在發送數據包后很難保證全部接收端都能夠正確接收。自動重傳請求(Automatic Repeat reQuest,ARQ)技術作為一種簡單有效的差錯控制方式被廣泛用于廣播通信中,以保證數據廣播的可靠性,其基本思想為接收端通過反饋信道請求重發出錯的數據包,發送端根據接收到的反饋信息重傳數據包,直到達到特定條件則終止重傳。目前,主要的HARQ方案包括PSARQ和NARQ。
1.3.1 PSARQ[26]
PSARQ方案要求接收端對接收出錯的數據包進行逐包反饋NACK,并且發送端在收到接收端反饋的NACK后,僅對出錯的數據包進行重傳。在多接收端場景中,不同接收端都對各自沒有成功接收的數據包進行反饋,基站在接收到所有接收端的NACK后,在下一個重傳階段內重傳沒有被全部接收端解碼的數據包。經過反復的“接收端反饋—基站重傳”過程,接收端接收出錯的數據包越來越少,基站通過接收的NACK統計數據包的覆蓋率。
1.3.2 NARQ[27]
NARQ方案是在PSARQ的基礎上采用網絡編碼技術改進得到的。在NARQ方案中,每個接收端對所有數據包進行解碼并對數據包反饋NACK?;靖鶕邮盏降姆答?,獲得每個接收端的每個數據包的丟失情況,并用一個數據包傳輸錯誤標志矩陣來表示。根據該矩陣,基站設計相應的異或網絡編碼策略,使得一個網絡編碼數據包能夠盡可能地包含多個原始數據包,并能被大部分接收端解碼。
NARQ方案相比于傳統的PSARQ方案,可以有效地減小重傳數據包的個數,但是直接將其應用于物聯網廣播通信中,會帶來兩個問題:一是反饋信息仍然數量較多;二是設計目標為實現100%的用戶成功接收,基站重傳編碼策略會受到每一個接收端接收情況的影響,因而系統性能隨著接收端數量的變化而產生較大變化。
面對海量的無線終端,無論是PSARQ還是NARQ方案,其逐包反饋機制會導致“反饋風暴”,從而大大增加系統開銷。因此,如何在提高無線數據廣播頻譜效率的同時降低反饋開銷,是大數據無線通信面臨的挑戰之一。
2 解決思路
2.1 高能效的大數據無線傳輸
2.1.1 休眠模式
M2M終端設備一般具有4種運行狀態,即發送、接收、空閑、休眠。設備正在發送數據或接收數據時,處于通信狀態,設備不進行數據收發時就處于空閑狀態,但此時也需要消耗能量。設備在休眠時的能耗遠小于其他3種狀態下的能耗,所以延長設備的休眠時間,使其在沒有數據需要發送或轉發時進入休眠狀態可以取得顯著的節能效果。
M2M設備的密度往往比較大,使得一些區域可能被多個設備所覆蓋,并且許多應用僅僅需要周期性地進行數據傳輸,這些特點為利用休眠調度機制節能提供了現實可能性。通過盡可能地關閉這些冗余設備,并使它們輪流工作以平衡網絡中的能耗,已成為延長網絡壽命的通用做法。但設備休眠時無法對信道進行偵聽,狀態切換時需要一定的恢復時間與啟動能量,所以還需要結合其他應用需求在各個設計指標之間進行合理權衡,如時間延遲、覆蓋率[28]等。
2.1.2 功率控制
在M2M設備消耗的所有能量中,通信模塊的能耗占了絕大部分,如文獻[29]指出,M2M設備的總能耗中通信部分占比達91%,所以在保證網絡連接可靠性的前提下減少發射功率能大大減少能量浪費。能量有效的功率控制還能夠減少節點間的干擾,實現對資源的最優化利用[30]。但是不同的發射功率會產生不同的拓撲結構,進而對路由協議、數據融合等其他協議造成影響,從而增加系統的復雜度以及硬件的處理能力。目前的研究一般將功率控制與其他節能技術進行聯合優化,如與路由協議的結合。鑒于M2M網絡的功率控制屬于NP-難問題[31],所以一般是采用近似解法或者智能算法。
2.1.3 路由協議
按照M2M設備狀態的不同,可以將能量有效路由協議分為兩類:節省通信狀態下能量消耗的路由協議和節省空閑狀態下能量消耗的路由協議[32]。
節省通信狀態下能量消耗的路由選擇方案研究主要包括兩個方面:一方面,尋找源節點到目的節點總體消耗能量最少的路由。具體方法是控制M2M設備的發送功率,使其達到保證正常傳輸數據分組的最小功率,通過降低路徑的總傳輸功率來節省M2M設備的電池能量,從而達到降低網絡總體消耗能量的目的,如果每個M2M設備的發送功率相同,尋找總發送功率最小的路由就成為尋找最小跳數路由。這一類路由協議有MTPR、PARO和COMPOW等。另一方面,盡量使網絡中的設備均衡地消耗能量,要求尋找路由時盡量選擇剩余能量高的M2M設備參與中繼轉發,同時避免使用剩余電池能量不足的M2M設備加入路由,避免低電M2M設備因耗盡電池能量退出網絡而造成網絡分割現象。這一類路由協議有LEAR、EDDSR、MBCR等。
根據M2M網絡邏輯結構的不同,還可以將網絡路由協議分為平面路由和層次路由兩種。由于平面路由缺乏對網絡資源的有效管理,反應速度跟不上網絡的動態變化,所以目前有關路由的研究以層次路由為主。在層次路由中,網絡一般被分為若干個簇(Clustering),每個簇分別由一個簇首(也稱為簇頭)對其他M2M設備(稱為簇成員)進行管理,負責收集它們的數據并進行融合,然后將結果發送給其他簇首[33]。通過這種方式可以減少數據發送的次數以降低網絡的能耗,同時也具有良好的擴展性,很好地滿足M2M網絡的大規模性。如何選擇簇首以及在簇首與基站間進行通信是層次路由研究的重點內容[34],其中簇首的選擇可能考慮的因素包括節點的剩余能量、節點的地理位置、節點的歷史當選信息、所在簇的規模大小等因素,而簇首與基站間通常采取多跳通信的方式,具體的轉發策略則不盡相同,如最短距離轉發、最小代價轉發、多路徑等[35]。
2.2 M2M系統的動態資源分配方法
在M2M系統中,傳統蜂窩網絡給每個用戶分配固定時頻資源的分配方式,將無法滿足大規模用戶需求。大數據無線通信對原有蜂窩網絡的接入控制和資源分配方式[10]提出了新的挑戰。
2.2.1 M2M系統的資源分配方法
文獻[36]在現有蜂窩網絡的接入控制與資源分配方案的基礎上通過建立專用承載的方式進行改進,提出了隨機接入請求方案以適應小數據量通信。文獻[37]利用“Moveright”[38]算法對TDMA策略進行資源分配優化,發現在業務數據量較小的條件下,平均資源分配的平均能耗值近似于最優化方案的平均能耗。文獻[39]提出了一種隨機接入CDMA策略和協調連續干擾消除策略,仿真結果驗證了在基站負載較小的情況下使用CDMA接入的可行性。
隨著多天線技術和連續干擾消除技術等高級信號處理技術的發展,基站處采用多包接收技術日趨成熟,即基站可以對多個設備同時發送的數據包進行正確譯碼。文獻[40]針對基站處采用連續干擾消除技術的上行接入問題,提出了一種基于瞬時信道信息條件的資源分配方法。文獻[41]在分析基于導頻的正交資源分配與基于用戶配對的非正交資源分配方案的折中關系的基礎上,提出了一種適用于大規模設備接入的基于用戶配對的資源分配方案。文獻[42]提出了一種基于周期分簇的能夠滿足不同QoS需求的M2M系統大規模接入控制方法,有效提高了M2M系統的能量效率和端到端時延,但該方法對無線資源進行正交性劃分,因此每個子信道僅能夠分配給一個設備。文獻[43]針對多小區系統中M2M設備的大規模接入與資源分配問題,提出了一種基于多分組的隨機接入與資源分配方法,在有效降低資源消耗總量的同時確保了系統較低的中斷概率。
2.2.2 M2M/H2H共存系統的資源分配方法
H2H系統主要關注高頻譜效率和高服務質量。M2M的群組通信、時延可控、延時容忍、低移動性、小數據傳輸等特點對系統的服務質量提出了新的要求。如何在M2M/H2H共存的系統中實現資源的有效分配是保證系統性能的關鍵所在。
針對時延受限條件下M2M/H2H共存的LTE系統的資源分配問題,文獻[25]提出了一種能量有效的無線資源分配方法,在確保了不同類型設備QoS性能的同時,有效降低了總的發送能量消耗。文獻[11]研究了M2M/H2H共存的LTE系統中的無線資源分配問題,給出了不同應用需求下的無線資源分配策略,提高了系統的可達速率性能。文獻[21]提出了一種統計QoS保障條件下能量有效的無線資源分配方法,有效提高了M2M/H2H共存的LTE系統的能量效率和QoS滿意度。
2.2.3 基于設備休眠的動態資源分配方法
針對蜂窩網絡中大量無線終端設備多址接入時資源分配問題。根據M2M通信隨機業務量大的特點,可以利用貪婪思想,結合智能丟包[44]的方法,以換取更多靠近基站的終端設備接入,從而實現負載增益的最大化。仿真結果表明,FDMA資源分配方式能夠帶來更多設備接入,而TDMA分配方式增益效果更明顯。在容許休眠的情況下,可以采用基站集中式的動態資源分配策略。在每次上傳數據時都讓剩余能量較少的幾個設備進入休眠模式,避免了一個設備耗盡能量時其他設備剩余大量能量造成能量利用率低下的問題。通過仿真發現在FDMA和TDMA資源分配方式中,分別使用平均功率最小和最小-最大法可以延長網絡壽命。為了降低基站因為集中式資源分配中的復雜優化運算帶來的復雜度,終端設備引入分布式機會上傳策略,各設備根據概率隨機通信,能夠有效提高TDMA方式中的網絡壽命。
2.3 基于部分反饋的有限集合網絡編碼自動重傳請求
針對大規模接收端數據廣播時面臨的“反饋風暴”問題,本文提出了一種有限集合網絡編碼自動重傳請求(Finite set Network coding Automatic Repeat reQuest,FNARQ)方案。通過設計逐輪反饋機制,在保證減小每個數據包平均傳輸次數的前提下,有效降低海量無線終端數據廣播系統的反饋負載,并利用有限集合網絡編碼進一步降低數據包平均傳輸次數。
與需要根據反饋信息動態確定編碼方式,并且滿足每一個接收端需求的NARQ方案不同,FNARQ考慮的是大多數接收端的需求,它需要在發送端和接收端處預置有限個數的網絡編碼方案,每次重傳根據所有接收端的反饋信息從有限編碼方案集合中選擇一種最有利用于大多數接收端解碼的方案對原始數據包進行編碼。FNARQ方案的過程描述如下:
(1)基站廣播數據包。
?。?)用戶對接收到的數據包進行譯碼,通過數據包尾部的CRC校驗判斷是否正確譯碼。若接收到的是原始數據包,則直接解碼即可;若接收到的是網絡編碼數據包,則通過在包頭處的信息獲知采用的是何種預置網絡編碼方案,利用已經解碼的原始數據包對網絡編碼數據包進行解碼。
?。?)完成一輪解碼后,若正確譯碼全部原始數據包,則進入靜默狀態;反之則根據原始數據包的解碼情況計算全部預置網絡編碼方案能夠帶來的解碼增益,通過反饋信道回傳能帶來最大解碼增益的網絡編碼方案序號。
?。?)基站根據接收到的反饋信息數量確定覆蓋率,若超過一定比例(大于用戶數量的CR)則廣播結束信息,廣播結束;反之則根據反饋信息確定采用的網絡編碼方案,發送網絡編碼數據包。
(5)重復步驟(2)~(4),直到廣播結束。
與傳統的PSARQ和NARQ方案相比較,有限集合自動反饋重傳方案,一方面極大地降低了反饋信息數量,同時,另一方面也提高了廣播通信的效率。
3 結束語
在移動蜂窩網絡是當前主流無線通信網絡的環境下,隨著物聯網、移動互聯網等業務的快速發展,移動蜂窩網絡由于其具有的移動性支持和廣域覆蓋等特性,已成為支撐物聯網、移動互聯網業務有效傳輸的重要途徑。本文分析了傳統蜂窩網絡承載大數據通信時面臨的能量有效、大規模接入控制和資源分配以及“反饋風暴”等挑戰,研究了大規模無線終端環境下,高能效的大數據無線傳輸、M2M系統的動態資源分配、基于部分反饋的有限集合網絡編碼自動重傳請求等方法,為改善大數據無線通信網絡性能提供了思路。
參考文獻
[1] Nature.BigData[DB/OL].[2014-11-27].http://www.nature.com/news/specials/bigdata/index.html.
[2] Science.Special online collection;Dealing with data[DB/OL].[2014-11-27].http://www.sciencemag.org/site/special/data.
[3] BRYANT R E,KATZ R H.Big-Data computing:Creating revolutionary break through sincommerce,science,andsociety[DB/OL].[2014-11-2].http://www.cra.org/ccc/docs/init/Big_Data.pdf.
[4] Tom Kalil.Big Data is a BigDeal[DB/OL].(2012-03-29)[2014-11-27].http://www.whitehouse.gov/blog/2012/03big-data-big-deal.
[5] Big Data[R].ERCIM News.2012(89).
[6] International Telecommunication Union.Internet reports 2005:the Internet of Things[R].Geneva:ITU,2005.
[7] Ericsson.More than 50 billion connected devices[R].2011.
[8] GHOSH A,ZHANG J,ANDREWS J G,et al.Fundamentals of LTE[M].Prentice-Hall,2010.
[9] QUEK T,DARDARI D,WIN M.Energy efficiency of dense wireless sensor networks: to cooperate or not to cooperate[J].IEEE Journal on Selected Areas in Communications,2007,25(2):459-470.
[10] CHAO H,CHEN Y,WU J.Power saving for machine to machine communications in cellular networks[C].Proc.201IEEE Globecom Workshops,389-393.
[11] ZHENG K,HU F,WANG W,et al.Radio resource alloca-tion in LTE-advanced cellular networks with M2M com-munications[J].IEEE Communications Magazine,2012,50(7):184-192.
[12] Chih-Hua Chang,Hung-Yun Hsieh.Not every bit counts:a resource allocation problem for data gathering in ma-chine-to-machine communications[C].Proc.IEEE Globe-com,2012.
[13] CHEN Y,WANG W.Machine-to-machine communication in LTE-A[C].Proc.2010 IEEE Veh.Technology Confer-ence,2010.
[14] ZHAO C,PERILLO M,HEINZELMAN W B.Generalnetwork lifetime and cost models for evaluating sensor network deployment strategies[J].IEEE Transactions on Mobile Computing,2008,7(4):484-497.