什麼是大資料,大資料是指什麼

什麼是大資料,大資料是指什麼,字面意思來看,就是大量的資料,

海量的資料

,今天直接從大資料的特性、發展來切入,介紹大資料。

大資料的特性主要是指4V,大資料的4V是什麼?其實是大資料的4個特性。與我們常聽到的5P營銷理論類似。

什麼是大資料,大資料是指什麼

4V

分別指Velocity,Volume,Varieyt,Value4個特性,也就是下面幾個意思

Velocity 快速化

Volume 大量化

Variety 多樣化

Value 價值密度低

快速化

是什麼意思,快速化是指隨著軟硬體技術水平的提升,CPU、記憶體、頻寬等這些硬體設施條件的提升,對於大量資料的處理速度,有著飛速的提升,分散式儲存與分散式計算都為大資料快速計算提供瞭解決方案。

大量化

是什麼意思,在當下正在完善的萬物互聯的物聯網時代,溫度感測器、PM2。5感測器裝置、監控等這些裝置,時時刻刻的在為網際網路提供著大量的資料。而大資料的增長速度,遵從摩爾定律,摩爾定律的核心內容為:積體電路上可以容納的電晶體數目在大約每經過18個月到24個月便會增加一倍。也就是可以理解為大資料量的增長每2年增長一倍。

多樣化

是什麼意思,資料型別繁多,打顆栗子,在90年代網際網路時期,網際網路中的資訊主要以文字形式傳達,再後來出現圖片與文字,然後到現在流行的影片與圖文,文字、圖片、影片這些資料以不同的資料型別儲存在本地,而只用於處理字元資料型別的演算法在此時就不再適用。

價值密度低

是什麼意思,有價值的資料量將佔很少一部分比例。人們日復一日的重複一樣的事情,如果在某一天突然發生一個意外事情,那麼這個事情的影響之大,也就是有價值的資料。意外事件瞬間的資料,單點價值就相對高很多。

大資料的發展階段

第一階段:運營式系統階段,初期的大資料運用,例如大型購物超市的收銀系統,每天的進出貨庫存等這些資料,進行統計分析。這個時候的資料生成由超市自行錄入。

第二階段:使用者原創內容階段,在這個時期,出現了各種自媒體平臺,網民開始在網上自由發聲,微博、部落格、微信、短影片等這些平臺的內容,主要由使用者主導生成大量的資料。

第三階段:感知式階段,大資料進入這個階段,也就是我們經常聽到的物聯網時代,萬物互聯,用在農業種植、工業生成、氣候監測等環境中的溫度感測器,定位系統資料追蹤與記錄,都在時時刻刻生成海量的資料,自此,進入大資料的高速發展階段。

這些海量的資料經過採集、清洗、儲存、計算與安全隱私包含處理後,用來進行科學研究、商業應用等,對人們的生活產生著不可忽視的影響。

以上透過對大資料的特性和大資料發展的介紹,讓大家瞭解大資料是什麼,那麼大資料的計算技術有哪些?且看下期的介紹。