四虎永久免费网站_高清一区二区三区日本久_欧美日韩在线中文字幕_久久天天狠狠_成人18精品视频_黄色av网站在线_在线视频观看一区二区_欧美国产一区二区_天天插天天色_欧美日韩国产综合在线

技術(shù)
`
2018/8/9 15:14

基于流式計(jì)算的DPI數(shù)據(jù)處理方案及實(shí)踐

0
0

【摘要】如何對海量的DPI數(shù)據(jù)進(jìn)行實(shí)時的采集以及處理是運(yùn)營商研究的熱點(diǎn),傳統(tǒng)基于MapReduce的批處理模式難以滿足流式計(jì)算實(shí)時性要求,因此首先介紹了流式處理相關(guān)概念,然后分析了目前流行的流式計(jì)算技術(shù),提出一種基于流式計(jì)算的DPI數(shù)據(jù)處理方案,并應(yīng)用在實(shí)際項(xiàng)目中,滿足電信運(yùn)營商對數(shù)據(jù)處理實(shí)時性的要求,最后通過實(shí)踐總結(jié)了流式處理的應(yīng)用場景。

【關(guān)鍵詞】DPI;流式計(jì)算;數(shù)據(jù)處理

doi:10.3969/j.issn.1006-1010.2018.01.000      中圖分類號:TN399      文獻(xiàn)標(biāo)志碼:A      文章編號:1006-1010(2018)01-0000-00

引用格式:范家杰,田熙清. 基于流式計(jì)算的DPI數(shù)據(jù)處理方案及實(shí)踐[J]. 移動通信, 2017,42(1): 00-00.

Scheme and Practice of DPI Data Processing Based on Stream Computing

FAN Jiajie, TIAN Xiqing

(Guangdong Research Institute of China Telecom Co., Ltd., Guangzhou 510630, China)

[Abstract] How to collect and process the massive DPI data in real time is the hotspot of telecom operators. The traditional batch mode MapReduce is difficult to meet the real-time requirements based on stream calculation, so this paper firstly introduces the related concepts of stream computing, and then analyzes the current popular streaming technology, presents a stream computing based on the DPI data processing program. This scheme is applied to practical projects to meet the requirements of telecom operators for real-time data processing. Finally, the application scenarios of streaming processing are summarized through practice.

[Key words] DPI; stream computing; data processing

1   引言

隨著移動互聯(lián)網(wǎng)的不斷發(fā)展以及各類智能設(shè)備日益深入民眾日常生活中,人類社會產(chǎn)生的數(shù)據(jù)量正在以指數(shù)級快速增長,人類已經(jīng)正式邁入大數(shù)據(jù)時代[1]。如今,運(yùn)營商能夠獲得的用戶數(shù)據(jù)越來越豐富,通過DPI(Deep Packet Inspector,深度分組檢測)分析技術(shù),能夠較好地識別網(wǎng)絡(luò)上的流量類別、應(yīng)用層上的應(yīng)用種類等[2]。在這個“數(shù)據(jù)為王”的時代,如何充分利用這筆重要的戰(zhàn)略資產(chǎn)已成為重中之重。

數(shù)據(jù)規(guī)模的快速增長給大數(shù)據(jù)分析處理帶來了巨大的挑戰(zhàn),尤其是在通信行業(yè),數(shù)據(jù)越發(fā)呈現(xiàn)出無限性、突發(fā)性和實(shí)時性等特征[3],傳統(tǒng)的基于MapReduce的批處理模式難以滿足數(shù)據(jù)實(shí)時性的要求,而能否在第一時間獲得數(shù)據(jù)所蘊(yùn)含的信息決定了數(shù)據(jù)的價值。因此,流式處理技術(shù)成為大數(shù)據(jù)技術(shù)研究的新熱點(diǎn)[4]。流式處理能夠針對數(shù)據(jù)的變化進(jìn)行實(shí)時處理,能夠在秒級獲得處理結(jié)果,特別適合一些對時效性要求很高的場景。

本文結(jié)合電信運(yùn)營商的需求,對DPI數(shù)據(jù)進(jìn)行實(shí)時的采集及處理,提出一種基于流式計(jì)算的DPI數(shù)據(jù)處理方案,能夠?qū)@得DPI數(shù)據(jù)實(shí)時信息的時延降低到分鐘級,甚至秒級,實(shí)現(xiàn)對電信用戶上網(wǎng)信息的實(shí)時處理、監(jiān)測及分類匯總,為之后進(jìn)行的大數(shù)據(jù)應(yīng)用提供了良好基礎(chǔ)。

2   流式處理概述

傳統(tǒng)基于MapReduce大數(shù)據(jù)處理技術(shù)實(shí)際上是一種批處理方式,如圖1所示。批處理模式首先要完成數(shù)據(jù)的累積和存儲,然后Hadoop客戶端將數(shù)據(jù)上傳到HDFS上,最后才啟動Map/Reduce進(jìn)行數(shù)據(jù)處理,處理后再寫入到HDFS。這種方式必須要所有數(shù)據(jù)都要準(zhǔn)備好,然后統(tǒng)一進(jìn)行集中計(jì)算和價值發(fā)現(xiàn),無法滿足實(shí)時性的要求。

圖1  批處理流程

圖1    基于MapReduce的大數(shù)據(jù)處理

2015年,Nathan Marz提出了實(shí)時大數(shù)據(jù)處理框架Lambda架構(gòu)[5],整合了離線計(jì)算和實(shí)時計(jì)算,能夠滿足實(shí)時系統(tǒng)高容錯、低時延和可擴(kuò)展等要求,并且可集成Hadoop、Kafka、Storm、Spark及HBase等各類大數(shù)據(jù)組件。

一個典型的Lambda架構(gòu)如圖2所示,主要使用的場景是邏輯復(fù)雜且延遲低的程序。數(shù)據(jù)會分別灌入實(shí)時系統(tǒng)和批處理系統(tǒng),然后各自輸出自己的結(jié)果,結(jié)果會在查詢端進(jìn)行合并。

圖2    Lambda架構(gòu)圖

3   流式計(jì)算架構(gòu)對比

流式計(jì)算對系統(tǒng)的容錯、時延、可擴(kuò)展及可靠性能力提出了很高的要求,當(dāng)前有許多流式計(jì)算框架(如Spark streaming[10]、Storm[11]、Kafka Stream[12]、Flink[13]和PipelineDB[14]等)已經(jīng)廣泛應(yīng)用于各行各業(yè),并且還在不斷迭代發(fā)展,適用的場景也各不相同。

3.1  Spark streaming

Spark是由加州大學(xué)伯克利分校AMP實(shí)驗(yàn)室專門為大數(shù)據(jù)處理而設(shè)計(jì)的計(jì)算框架[6]。Spark Streaming是建立在Spark上的實(shí)時計(jì)算框架,是Spark的核心組件之一,通過它內(nèi)置的API和基于內(nèi)存的高效引擎,用戶可以結(jié)合流處理、批處理和交互式查詢開發(fā)應(yīng)用。

Spark Streaming并不像其他流式處理框架每次只處理一條記錄,而是將流數(shù)據(jù)離散化處理,每次處理一批數(shù)據(jù)(DStream),使之能夠進(jìn)行秒級以下的快速批處理,執(zhí)行流程如圖3所示。Spark Streaming的Receiver并行接收數(shù)據(jù),將數(shù)據(jù)緩存至內(nèi)存中,經(jīng)過延遲優(yōu)化后Spark引擎對短任務(wù)(幾十毫秒)進(jìn)行批處理。這樣設(shè)計(jì)的好處讓Spark Streaming能夠同時處理離線處理和流處理問題。

圖3    Spark Streaming執(zhí)行流程

Spark Streaming能在故障報(bào)錯下迅速恢復(fù)狀態(tài),整合了批處理與流處理,內(nèi)置豐富高級算法處理庫,發(fā)展迅速,社區(qū)活躍。毫無疑問,Spark Streaming是流式處理框架的佼佼者。缺點(diǎn)是由于需要累積一批小文件才處理,因此時延會稍大,是準(zhǔn)實(shí)時系統(tǒng)。

3.2  Storm

Storm通常被比作“實(shí)時的Hadoop”,是Twitter開發(fā)的實(shí)時、分布式以及具備高容錯計(jì)算系統(tǒng),可以簡單、可靠地處理大量數(shù)據(jù)流,用戶可以采用任意編程語言來開發(fā)應(yīng)用。

在Storm中,一個用于實(shí)時計(jì)算的圖狀結(jié)構(gòu)稱之為拓?fù)洌╰opology),拓?fù)涮峤坏郊海杉褐械闹骺毓?jié)點(diǎn)分發(fā)代碼,分配任務(wù)到工作節(jié)點(diǎn)執(zhí)行。一個拓?fù)渲邪╯pout和bolt兩種角色,其中spout發(fā)送消息,負(fù)責(zé)將數(shù)據(jù)流以tuple元組的形式發(fā)送出去;而bolt則負(fù)責(zé)轉(zhuǎn)換這些數(shù)據(jù)流,在bolt中可以完成映射map、過濾filter等操作,bolt自身也可以隨機(jī)將數(shù)據(jù)發(fā)送給其他bolt。

圖4    Storm數(shù)據(jù)流動

Storm能將數(shù)據(jù)在不同的bolt中流動、移動數(shù)據(jù),真正實(shí)現(xiàn)流式處理,易于擴(kuò)展,靈活性強(qiáng),高度專注于流式處理。Storm在事件處理與增量計(jì)算方面表現(xiàn)突出,能夠以實(shí)時方式根據(jù)不斷變化的參數(shù)對數(shù)據(jù)流進(jìn)行處理。

3.3  Kafka Stream

Kafka Stream是Apache Kafka開源項(xiàng)目的一個組成部分,是一個功能強(qiáng)大、易于使用的庫,它使得Apache Kafka擁有流處理的能力。

Kafka Stream是輕量級的流計(jì)算類庫,除了Apache Kafka之外沒有任何外部依賴,可以在任何Java程序中使用,使用Kafka作為內(nèi)部消息通訊存儲介質(zhì),因此不需要為流處理需求額外部署一個集群。

Kafka Stream入門簡單,并且不依賴其他組件,非常容易部署,支持容錯的本地狀態(tài),延遲低,非常適合一些輕量級流處理的場景。

3.4  Flink

Flink是一個面向分布式數(shù)據(jù)流處理和批量數(shù)據(jù)處理的開源計(jì)算平臺,同時支持批處理以及流處理,主要針對流數(shù)據(jù),將批數(shù)據(jù)視為流數(shù)據(jù)的一個極限特例。

Flink核心是一個流式的數(shù)據(jù)流執(zhí)行引擎,它提供了數(shù)據(jù)分布、數(shù)據(jù)通信以及容錯機(jī)制等功能。流執(zhí)行引擎之上,F(xiàn)link提供了更高層次的API以便用戶使用。Flink還針對某些領(lǐng)域提供了領(lǐng)域庫,例如Flink ML、Flink的機(jī)器學(xué)習(xí)庫等。

Flink適合有極高流處理需求,并有少量批處理任務(wù)的場景。該技術(shù)可兼容原生Storm和Hadoop程序,可在YARN管理的集群上運(yùn)行。目前Flink最大的局限之一是在社區(qū)活躍度方面,該項(xiàng)目的大規(guī)模部署尚不如其他處理框架那么常見。

3.5  PipeLineDB

PipelineDB是基于PostgreSQL的一個流式計(jì)算數(shù)據(jù)庫,效率非常高,通過SQL對數(shù)據(jù)流做操作,并把操作結(jié)果儲存起來。其基本過程是:創(chuàng)建PipelineDB Stream、編寫SQL、對Stream做操作、操作結(jié)果被保存到continuous view。

PipelineDB特點(diǎn)是可以只使用SQL進(jìn)行流式處理,不需要代碼,可以高效可持續(xù)自動處理流式數(shù)據(jù),只存儲處理后的數(shù)據(jù),因此非常適合流式數(shù)據(jù)處理,例如網(wǎng)站流量統(tǒng)計(jì)、網(wǎng)頁的瀏覽統(tǒng)計(jì)等。

3.6  架構(gòu)對比

上文提到的5種流式處理框架對比如表1所示:

表1    流式框架對比

Storm的特點(diǎn)是成熟,是流式處理框架實(shí)際上的標(biāo)準(zhǔn),模型、編程難度都比較復(fù)雜,框架采用循環(huán)處理數(shù)據(jù),對系統(tǒng)資源,尤其是CPU資源消耗很大,當(dāng)任務(wù)空閑時,需要sleep程序,減少對資源的消耗。Spark Streaming兼顧了批處理以及流式處理,并且有Spark的強(qiáng)大支持,發(fā)展?jié)摿Υ螅cKafka的接口平滑性不夠。Kafka Stream是Kafka的一個開發(fā)庫,具有入門、編程、部署運(yùn)維簡單的特點(diǎn),并且不需要部署額外的組件,但對于多維度的統(tǒng)計(jì)來說,需要基于不同topic來做分區(qū),編程模型復(fù)雜。Flink跟Spark Streaming很像,不同的是Flink把所有任務(wù)當(dāng)成流來處理,在迭代計(jì)算、內(nèi)存管理方面比Spark Streaming稍強(qiáng),缺點(diǎn)是社區(qū)活躍度不高,還不夠成熟;PipelineDB是一個流式計(jì)算數(shù)據(jù)庫,能執(zhí)行簡單的流式計(jì)算任務(wù),優(yōu)勢是基本不需要開發(fā),只要熟悉SQL操作均可以輕松使用,但對于集群計(jì)算,需要商業(yè)上的支持。

4   DPI數(shù)據(jù)處理方案

基于實(shí)際任務(wù)需求以及上文流式框架的對比,由于Kafka Stream編程難度小,不需要另外安裝軟件,與Kafka等組件無縫連接,比較穩(wěn)定,并且各種性能均比較優(yōu)秀,因此本文選擇了Kafka Stream作為流式處理的核心組件。

4.1  寬帶DPI處理

為了完成寬帶DPI數(shù)據(jù)的實(shí)時抓包、資料填補(bǔ)、清洗、轉(zhuǎn)換及并入庫等工作,應(yīng)用了上述DPI數(shù)據(jù)處理方案。具體項(xiàng)目方案如圖5所示:

圖5    廣州寬帶DPI處理方案

Mina進(jìn)程是一個JAVA程序,基于mina框架開發(fā),主要接收AAA數(shù)據(jù)包,獲得用戶賬戶信息,解析計(jì)算,并持久化到redis,最后發(fā)送給抓包(Capture)程序。Capture程序由C語言編寫,使用開源pcap抓取網(wǎng)卡http包,解析,結(jié)合用戶帳號資料,把DPI寫入到Kafka中。Kafka stream完成DPI的實(shí)時清洗和轉(zhuǎn)換工作。

Flume[15]是Cloudera開源的分布式可靠、可用、高效的收集,聚合和移動不同數(shù)據(jù)源的海量數(shù)據(jù)系統(tǒng),配置簡單,基本無需開發(fā),資源消耗低,支持傳輸數(shù)據(jù)到HDFS,非常適合與大數(shù)據(jù)系統(tǒng)結(jié)合。本項(xiàng)目將流式處理完后的數(shù)據(jù)通過Flume從Kafka中寫入到HDFS,建立hive表,為上層應(yīng)用提供數(shù)據(jù)。

Kafka Stream采用自主研發(fā)的ETL框架[16],負(fù)責(zé)數(shù)據(jù)過濾(圖片、視頻等去掉),數(shù)據(jù)處理(獲取網(wǎng)絡(luò)ID、字段解析等)。ETL框架采用JAVA語言開發(fā),支持多種數(shù)據(jù)源,包括普通文本、壓縮格式及xml立體格式等。支持多種大數(shù)據(jù)計(jì)算框架,包括Map/Reduce、Spark streaming、Kafka Stream和Flume等;具有擴(kuò)展方便、字段校驗(yàn)、支持字段的通配符及支持維表查詢等功能。在運(yùn)維方面,支持變量引用以及出錯處理等功能。

4.2  4G DPI實(shí)時統(tǒng)計(jì)

以電信4G DPI信息作為數(shù)據(jù)源,通過流式處理,完成DPI的實(shí)時統(tǒng)計(jì)工作,包括多粒度(5分鐘/1小時/1天)去重用戶統(tǒng)計(jì)、多粒度去重不同號碼頭用戶統(tǒng)計(jì)、多粒度流量統(tǒng)計(jì)及多粒度去重域名統(tǒng)計(jì)等。4G DPI實(shí)時統(tǒng)計(jì)具體項(xiàng)目方案如圖6所示:

圖6    4G DPI實(shí)時統(tǒng)計(jì)方案圖

數(shù)據(jù)源是gzip壓縮文件,因?yàn)閒lume原生不支持.gz或.tar.gz文件格式,所以修改了Flume底層代碼,實(shí)現(xiàn)對壓縮文件的處理,省去了解壓時間。Flume采集文件時以用戶手機(jī)號碼作為分區(qū)的key,將同一號碼的數(shù)據(jù)分到同一分區(qū),便于去重。通過Kafka集群管理工具,Kafka Manager[17]可以很好地監(jiān)測Kafka集群的狀態(tài)。Kafka集群生產(chǎn)者如圖7所示:

圖7    Kafka集群生產(chǎn)者

Kafka Stream消費(fèi)4GDPI的數(shù)據(jù),并行處理。在程序里設(shè)置不同的計(jì)數(shù)器,所有數(shù)據(jù)都經(jīng)過這些計(jì)數(shù)器處理,為了解決去重問題,引入了布隆過濾,雖然有一定的誤判率,但是還是能比較好的完成去重,同時保證系統(tǒng)的性能。同樣消費(fèi)者也可以通過Kafka Manager進(jìn)行管理,可以直觀觀察到消費(fèi)者的落后程度。

為了滿足不同的輸出要求,程序設(shè)置了三種輸出供選擇。粒度為天的數(shù)據(jù)將會寫到MySQL作為備份,針對熱點(diǎn)區(qū)域的監(jiān)控?cái)?shù)據(jù)將會輸出到Redis,同時,為了方便管理以及數(shù)據(jù)呈現(xiàn),還采用了ELK框架(ElasticSearch+Logstash+Kibana),將所有數(shù)據(jù)傳到Kibana做前端展示。Kibana界面如圖8所示:

圖8    Kibana界面

5   實(shí)踐及分析

5.1  部署實(shí)踐

上述兩個系統(tǒng)均已應(yīng)用在實(shí)際的生產(chǎn)中,均有不錯的表現(xiàn),能夠滿足任務(wù)需求,并且已經(jīng)穩(wěn)定運(yùn)行。

寬帶DPI處理項(xiàng)目有2臺采集機(jī)、1臺AAA服務(wù)器及5臺Kafka機(jī)器。采集機(jī)每臺每秒產(chǎn)生115 MB數(shù)據(jù),兩臺1.8 G流量。采集機(jī)寫Kafka 33萬條/秒,Kafka Stream寫Kafka 22萬條/秒,清洗率(清洗工作把諸如圖片、視頻及js請求等與業(yè)務(wù)無關(guān)的DPI信息去掉)為33%。Kafka Stream落后處理穩(wěn)定在500萬數(shù)據(jù),延遲處理在15 s之內(nèi),F(xiàn)lume寫HDFS落后保持在100萬左右,5 s內(nèi)的延遲。寬帶DPI處理項(xiàng)目性能如圖9所示:

圖9    寬帶DPI處理項(xiàng)目性能

4G DPI實(shí)時統(tǒng)計(jì)項(xiàng)目共6臺機(jī)器,1臺為Flume采集機(jī),其余5臺部署Kafka、Kafka Stream及ELK。采集機(jī)寫Kafka一般為10萬條/秒,峰值可達(dá)到25萬條/秒。ElasticSearch集群一共8個實(shí)例,每個實(shí)例配置2 G內(nèi)存。目前集群有13億條數(shù)據(jù),占361 G空間。通過Logstash導(dǎo)入數(shù)據(jù)到ElasticSearch峰值可以達(dá)到8~9萬條/秒。Kafka Stream處理數(shù)據(jù)落后在10 s內(nèi),Logstash寫ElasticSearch落后在5 s內(nèi),如圖10所示。目前4G DPI實(shí)時統(tǒng)計(jì)項(xiàng)目日均處理文件超過15 000個,大小達(dá)到1.6 T,日均處理記錄數(shù)超過100億。

圖10    4G DPI實(shí)時統(tǒng)計(jì)項(xiàng)目性能

5.2  存在的問題

在4G DPI實(shí)時統(tǒng)計(jì)項(xiàng)目開發(fā)過程中,隨著項(xiàng)目的需求越來越多,后面增加了對域名和CGI的去重,而且同一域名或者CGI不在同一Kafka分區(qū),導(dǎo)致結(jié)果有偏差。為了解決這一問題,程序設(shè)計(jì)了二次去重,第一次去重的結(jié)果把CGI或者域名作為key輸出到Kafka集群,再做了一次去重工作,導(dǎo)致延遲時間變大和系統(tǒng)維護(hù)變復(fù)雜。

由于寬帶DPI處理中不涉及去重,只是數(shù)據(jù)過濾和數(shù)據(jù)轉(zhuǎn)換,因此Kafka Stream是非常適合的。但在涉及分區(qū)和去重的4G DPI實(shí)時統(tǒng)計(jì)項(xiàng)目中,應(yīng)當(dāng)采用Storm作為流式處理框架。在Storm中,數(shù)據(jù)從一個bolt流到另外一個bolt,這樣數(shù)據(jù)可以在一個bolt中按手機(jī)號碼分區(qū),在另外一個bolt中又可以按CGI或者域名分區(qū),可以避免二次去重問題,降低編程模型復(fù)雜度。

在程序設(shè)計(jì)之初,應(yīng)根據(jù)應(yīng)用場景需求選擇合適的技術(shù)框架。如果項(xiàng)目基礎(chǔ)結(jié)構(gòu)中涉及Spark,那Spark Streaming是不錯的選擇;如果像4G DPI實(shí)時統(tǒng)計(jì)項(xiàng)目一樣需要數(shù)據(jù)轉(zhuǎn)移或者去重,那么Storm是首選;如果是簡單的數(shù)據(jù)清洗和轉(zhuǎn)換處理,那么Kafka Stream是不錯的選擇。對于簡單小規(guī)模的實(shí)時統(tǒng)計(jì),PipeLineDB足以勝任。

6   結(jié)束語

大數(shù)據(jù)流式計(jì)算和批處理適用于不同的業(yè)務(wù)場景,在對時效要求高的場景下,流式計(jì)算具有明顯的優(yōu)勢。本文首先概述了流式處理以及其與批處理的區(qū)別,然后對業(yè)界流行的流式計(jì)算框架進(jìn)行了對比,根據(jù)業(yè)務(wù)需求提出了以Kafka Stream為流式處理框架的DPI數(shù)據(jù)處理方案,搭配Kafka、Flume及ELK等組件,具有入門迅速、編程難度低和部署維護(hù)簡單等特點(diǎn)。并且將方案應(yīng)用到了寬帶DPI處理項(xiàng)目以及4G DPI實(shí)時統(tǒng)計(jì)項(xiàng)目中,完成了任務(wù)需求,性能優(yōu)異,運(yùn)行穩(wěn)定。

在對實(shí)際項(xiàng)目實(shí)踐中,隨著任務(wù)需求的增多,發(fā)現(xiàn)Kafka Stream在應(yīng)對多維度數(shù)據(jù)去重問題時表現(xiàn)不力,需要引入二次過濾來解決問題。因此在項(xiàng)目需求階段,便要在技術(shù)框架選型時充分考慮可能出現(xiàn)的問題,結(jié)合技術(shù)框架適用場景,綜合考慮。

[1] Zikopoulos P, Eaton C. Understanding Big Data: Analytics for Enterprise Class Hadoop and Streaming Data[M]. McGraw-Hill Osborne Media, 1989.

[2] 陳康,付華崢,陳翀,等. 基于DPI的用戶興趣實(shí)時分類[J]. 電信科學(xué), 2016,32(12): 109-115.

[3] 孫大為,張廣艷,鄭緯民. 大數(shù)據(jù)流式計(jì)算:關(guān)鍵技術(shù)及系統(tǒng)實(shí)例[J]. 軟件學(xué)報(bào), 2014,25(4): 839-862.

[4] 董斌,楊迪,王錚,等. 流計(jì)算大數(shù)據(jù)技術(shù)在運(yùn)營商實(shí)時信令處理中的應(yīng)用[J]. 電信科學(xué), 2015,31(10): 165-171.

[5] Marz N,Warren J. Big Data: Principles and best practices of scalable realtime data systems[M]. Manning, 2015.

[6] 李祥池. 基于ELK和Spark Streaming的日志分析系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[J]. 電子科學(xué)技術(shù), 2015,2(6): 674-678.

[7] 李圣,黃永忠,陳海勇. 大數(shù)據(jù)流式計(jì)算系統(tǒng)研究綜述[J]. 信息工程大學(xué)學(xué)報(bào), 2016,17(1): 88-92.

[8] 姚仁捷. Kafka在唯品會的應(yīng)用實(shí)踐[J]. 程序員, 2014(1): 110-113.

[9] 郝璇. 基于Apache Flume的分布式日志收集系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[J]. 軟件導(dǎo)刊, 2014(7): 110-111.

[10] Spark. Spark Streaming Programming Guide[EB/OL]. [2017-09-14]. http://spark.apache.org/docs/latest/streaming-programming-guide.html.

[11] Storm. Apache Storm[EB/OL]. [2017-09-14]. http://storm.apache.org/index.html.

[12] Kafka Stream. Kafka Streams API[EB/OL]. [2017-09-14]. http://kafka.apache.org/documentation/streams/.

[13] Flink. Introduction to Apache Flink®[EB/OL]. [2017-09-14]. https://flink.apache.org/introduction.html.

[14] PipelineDB. The Streaming SQL Database[EB/OL]. [2017-09-14]. https://www.pipelinedb.com/.

[15] Apache Flume™. Apache Flume™[EB/OL]. [2017-09-14]. http://flume.apache.org/index.html.

[16] Kafka Stream. ETL[EB/OL]. [2017-09-14]. https://github.com/styg/bumblebee-ETL.

[17] Kafka Stream. Kafka Manager[EB/OL]. [2017-09-14]. https://github.com/yahoo/kafka-manager. ★

作者簡介

田熙清:碩士畢業(yè)于大連理工大學(xué)系統(tǒng)工程專業(yè),現(xiàn)任職于中國電信股份有限公司廣州研究院,研究方向?yàn)榇髷?shù)據(jù)平臺及處理。

范家杰:碩士畢業(yè)于中山大學(xué),現(xiàn)任職于中國電信股份有限公司廣州研究院,研究方向?yàn)榇髷?shù)據(jù)平臺及處理。

免責(zé)聲明:本文僅代表作者個人觀點(diǎn),與C114通信網(wǎng)無關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí),對本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實(shí)相關(guān)內(nèi)容。

給作者點(diǎn)贊
0 VS 0
寫得不太好

C114簡介     聯(lián)系我們     網(wǎng)站地圖

Copyright©1999-2025 c114 All Rights Reserved 滬ICP備12002291號-4

C114通信網(wǎng)版權(quán)所有 舉報(bào)電話:021-54451141 用戶注銷

国产激情视频网站| 青青久草在线| 日本最新一区二区三区视频观看| 欧美日韩午夜精品| 美女黄网久久| 精品九九久久| 韩国三级在线观看久| 欧美精品小视频| 人妻少妇精品一区二区三区| 免费一级特黄特色毛片久久看| 久久天天躁日日躁| 色88888久久久久久影院野外| 色综合久久网| 岛国视频一区| 欧美一级久久久| 九色综合狠狠综合久久| 久久久精品国产**网站| 黄色片在线看| 免费黄色大片| 国产视频在线一区| 欧美日韩精品在线观看视频| 久久九九国产视频| 亚洲第一综合色| 亚洲尤物影院| 国产乱人伦丫前精品视频| 日本在线看片免费人成视1000| 深夜福利小视频| 久久影视中文字幕| 91久久精品国产91性色| 亚洲男人7777| 欧美图区在线视频| 久久久久久久久一| 韩国v欧美v亚洲v日本v| 精品二区视频| 青青草97国产精品麻豆| 6080成人| 日日爱夜夜操| 国产精品久久久久影院日本| 日韩精品在线免费观看| 色婷婷久久99综合精品jk白丝| 中文乱码免费一区二区| 成人毛片在线观看| 喷水一区二区三区| 激情综合在线| 99精品电影| 欧美精品国产白浆久久久久| 四虎精品在线观看| 人狥杂交一区欧美二区| 欧美一区二区激情视频| 佐佐木明希电影| 国产麻花豆剧传媒精品mv在线| 国产日产欧美一区二区| 日本一区二区三区免费观看 | 日本欧美一区二区| 在线成人欧美| 欧美/亚洲一区| 99精品视频在线| 日本一本不卡| 黄色网页在线播放| 美女欧美视频在线观看免费 | 女人抽搐喷水高潮国产精品| 福利写真视频网站在线| 欧美videos极品另类| 色网在线视频| 在线国产视频| 蜜臀在线观看| 四虎精品在线| 国产视频三级在线观看播放| 精品乱码一区二区三四区视频 | 亚洲日本色图| 深爱五月激情五月| 久久久精品在线视频| 裸体裸乳免费看| 97超碰人人爱| 欧美无砖专区免费| 国产h视频在线播放| 欧美在线观看成人| 亚洲天堂视频在线观看免费| 国产精品青草久久久久福利99| 草民午夜欧美限制a级福利片| 国产亚洲成精品久久| 在线日韩欧美视频| 欧美成人免费播放| 992tv在线成人免费观看| 久久久亚洲影院| 欧美一级淫片aaaaaaa视频| 欧洲成人免费aa| 国产裸体写真av一区二区 | 日韩不卡的av| 蜜月aⅴ免费一区二区三区| 这里精品视频免费| 久久久成人精品视频| 久久久久久国产| 日韩av电影在线播放| 成人a在线视频| 久久精品国产一区二区三区日韩 | 99久久久久成人国产免费| 亚洲第一天堂网| 老师让我她我爽了好久视频| 国产精品18久久久久久久久久| 欧美在线免费观看亚洲| 中文字幕乱码中文乱码51精品| 国产黄色大片在线观看| 91精品xxx在线观看| avtt久久| 欧美女王vk| 欧美精品三区| 久久www免费人成看片高清| 成人一级片在线观看| 国产免费久久精品| 日本道色综合久久| 亚洲精品av在线| 欧美另类在线播放| 成人日韩av在线| 日韩视频精品| 欧美性大战久久久久久久| 欧美精品一区二区三区蜜臀| 在线看福利67194| 国产成人av在线| 久久久久久久久久久一区| 成人国产在线看| 九九热视频免费| 亚洲一二三在线观看| 日本欧美www| 久热中文字幕在线精品首页| 亚洲电影欧美电影有声小说| 亚洲综合图区| 国产精品毛片视频| 国产精品亚洲综合久久| 久久综合色综合88| 欧美影院一区二区| 国产亚洲精品免费| 麻豆精品精品国产自在97香蕉| 麻豆美女网站| 伊人资源视频在线| 日韩精品一级二级 | 精品国产黄a∨片高清在线| 亚洲欧美国产一区二区三区| 国产精品嫩草影院桃色| 国产福利一区二区| 成人不卡免费视频| 91麻豆精品激情在线观看最新 | 久久av高潮av无码av喷吹| 91精品视频一区二区| 欧美在线视频免费| 欧美一级片在线免费观看| www久久久| 免费看污污视频| 精品三级av在线导航| 成人一对一视频| 99精品热视频只有精品10| 波多野结衣一本| 欧美国产精品久久| 女人18毛片水真多18精品| 欧美日韩精品一区二区三区蜜桃 | 天堂√中文在线| 久久精品一区二区三区四区| 在线观看国产网站| 午夜久久福利| 亚洲免费黄色网| 丝袜+亚洲+另类+欧美+变态| 国产一区二区三区在线看| 欧美五级在线观看视频播放| 欧美天堂一区二区三区| 国产精品免费无遮挡| 五月天一区二区| 精品人妻中文无码av在线| 成人高清av| 欧美精品欧美精品系列c| 永久免费不卡在线观看黄网站| 欧美亚洲国产一区二区三区va| 色偷偷福利视频| 在线91免费看| 日韩中文字幕久久久经典网| 亚洲乱码国产乱码精品精的特点| 五月天婷婷影视| 国产色播av在线| 日韩精品一二三四区| 亚洲第一成人网站| 嫩呦国产一区二区三区av| 欧美中文字幕不卡| 国产网友自拍视频| 99国产精品久| 国产伦精品一区二区三区免.费| 国产欧美va欧美不卡在线| 中文字幕乱伦视频| 中文字幕一区二区三区四区| 成人免费看片98| 精品72久久久久中文字幕| 国产精品一区专区欧美日韩| 国产免费拔擦拔擦8x高清在线人| 国产精品视频资源| 麻豆av在线免费观看| 成年人三级视频| 神马香蕉久久| 一区二区在线免费观看视频| 麻豆国产91在线播放| 日本少妇性生活| 亚洲精品ww久久久久久p站| 欧美自拍偷拍第一页| 日韩欧美在线1卡| 在线理论视频| 91社在线播放| 国产精品一区三区| 影音先锋男人看片资源站| 亚洲欧美精品suv| 天天av综合网| 品久久久久久久久久96高清| 亚洲精一区二区三区| 久久精品视频亚洲| 国产精品17p| 在线观看黄色国产| 九九久久久久99精品| 深爱激情综合网| 国产精品无码久久av| 97超级碰碰碰久久久| 色97色成人| 国产极品久久久| 国产成人综合一区二区三区| 亚洲三级国产| 精品一区二区在线欧美日韩| 91禁外国网站| 亚洲国产福利| 日本中文字幕观看| 91免费在线视频观看| 欧美性猛交xxxx免费看手交| 午夜精品一区二区三区视频免费看| 户外露出一区二区三区| 亚洲欧美手机在线| 中文字幕一区在线| 成年人免费在线观看网站| 亚洲aa在线观看| 日韩成人av在线资源| 欧美成人国产精品一区二区| 岛国一区二区三区| 免费永久在线观看黄网| 亚洲欧美精品suv| 91精品大全| 精品一区日韩成人| 高潮精品一区videoshd| 成人天堂入口网站| 国产精品igao视频| 欧洲一区在线| 欧美人妻一区二区| 在线亚洲欧美专区二区| 天海翼女教师无删减版电影| 午夜精品短视频| 欧美激情中文字幕一区二区| 中日韩免费毛片| 精品人妻无码中文字幕18禁| 欧美喷水一区二区| 玖玖玖电影综合影院| 看片网址国产福利av中文字幕| 久久精品天堂| 成人爽a毛片一区二区| 国产精品视频网址| 久久精品国产久精国产| www.午夜| 天天干天天综合| 在线播放欧美女士性生活| 国产精品xnxxcom| 国产黄色小视频在线观看| 精品无人区一区二区三区 | 人妻视频一区二区三区| 日韩免费av电影| 亚洲老司机在线| 日韩大尺度黄色| 一级二级三级视频| 欧美一级日本a级v片| 亚洲欧洲精品一区二区三区不卡| 久cao在线| 久久久久久久久久99| 国产国产精品人在线视| 韩国一区二区在线观看| 秋霞午夜理伦电影在线观看| 欧美激情小视频| 视频一区免费在线观看| av男人的天堂在线观看| 开心激情综合网| 三级黄色片免费看| 91最新在线免费观看| 精品乱人伦小说| 福利一区二区在线观看| 久久伊人久久| 亚洲做受高潮| 一区二区三区午夜| 熟女人妇 成熟妇女系列视频| 高清欧美一区二区三区| 高清国产一区二区三区| 伊人色综合久久| 色哟哟精品观看| 国产精品扒开腿做爽爽爽男男| 精品在线视频一区| 亚洲成人套图| 日日操免费视频| 成人免费观看a| 国产日韩影视精品| 国产一区二区三区影视| 十八禁一区二区三区| www插插插无码免费视频网站| 欧美日韩亚洲综合一区| 91精品国产自产在线观看永久∴| 精品网站www| 欧美日韩在线观看一区| 亚洲精品菠萝久久久久久久| 亚洲一区二区av| 欧美娇小性xxxx| 欧美成人精品一区二区综合免费| 亚洲人成电影在线| 亚洲男同性恋视频| 国产一区二区三区不卡视频网站| 日本高清好狼色视频| 国内精品久久99人妻无码| 正在播放欧美一区| 欧美成人直播| 日本中文字幕电影在线观看| 一区二区三区播放| 欧美国产日韩在线视频| 成人xxxxx色| 久久精品成人一区二区三区| 亚洲视频在线观看一区| av成人天堂| 国产精品日本一区二区不卡视频| 免费看黄视频网站| 亚洲欧洲精品在线| 日韩欧美一级特黄在线播放| 成av人片一区二区| 欧美电影三区| 久久亚洲人体| 日本中文字幕在线观看| 成人精品美女隐私视频| 波多野结衣高清视频| 欧洲熟妇的性久久久久久| 五月天亚洲综合情| 日本精品视频网站| 亚洲电影免费观看高清完整版在线观看 | 99久久精品国产一区二区成人| 免费的av网站| 国内少妇毛片视频| 亚洲伊人久久综合| 欧美激情亚洲另类| 欧美三级免费| 免费网站看v片在线a| 爽爽免费视频| 狠狠色一日本高清视频| 丰满少妇又爽又紧又丰满电影| 亚洲av成人精品日韩在线播放| 国产黄色小视频在线观看| 国产av无码专区亚洲a∨毛片| 91片黄在线观看喷潮| 欧美日韩国产精品综合| 久久久精品国产sm调教| 污污的视频在线免费观看| 欧美视频一区二区在线| 久久久久免费看| 中文字幕av影视| 99re只有精品| 国产精品51麻豆cm传媒| 五月天免费网站| 夫妻免费无码v看片| 日韩欧美99| 久久久久久91香蕉国产| 亚洲第一精品自拍| 亚洲成人精品影院| 国产精品卡一卡二卡三| 黄色一区二区三区四区| 国产精品手机在线播放| 日韩欧美精品一区二区综合视频| 色网站在线看| 亚洲美女在线免费观看| 九色蝌蚪性视频| 国产欧美在线观看视频| 亚洲黄色a级片| 欧美人妻精品一区二区三区 | 国产在线高清| 国产一卡2卡3卡四卡网站| 无码精品视频一区二区三区 | 性欧美18~19sex高清播放| 奇米影视狠888| 国产乱淫片视频| 国产午夜精品福利视频| aaaaaa亚洲| 日韩小视频在线播放| 午夜精品电影在线观看| 91免费在线视频网站| 欧美亚洲成人xxx| 国产精品视频男人的天堂| 久久成人亚洲精品| 国产xxx69麻豆国语对白| 国产精品com| 亚洲高清在线观看一区| 久久这里只有精品23| 精品人妻一区二区三| 性猛交娇小69hd| 国产一区二区视频网站| 深夜福利视频网站| 欧美色欧美亚洲另类二区精品| 狠狠干天天爱| 毛片大全在线观看| 中文字幕+乱码+中文|