
一、通過“眾包”產(chǎn)生和收集數(shù)據(jù)
高德地圖、地圖都有實時路況的功能,但大家有沒有想過實時路況的數(shù)據(jù)是怎么收集的?實際上經(jīng)過了三個階段,開始是跟交通口的一些公司合作,獲取交通流量監(jiān)測設(shè)備的數(shù)據(jù),這個方法缺陷很明顯,一個是受制于人,一個是想擴大監(jiān)測范圍就要部署大量設(shè)備,費時費力,而且還受法律制約。于是一些專門做路況的公司開始用出租車當(dāng)浮動車收集數(shù)據(jù)。但這種辦法還是無法覆蓋大量的大小路段,隨著移動互聯(lián)網(wǎng)的普及,高德地圖的APP能夠?qū)崟r上傳大量機動車的速度和位置信息,經(jīng)過去噪和綜合分析,就形成了覆蓋率極高的實時路況信息。這就是一個典型的“眾包”過程。
大數(shù)據(jù)的“海量數(shù)據(jù)”就是由“眾包”產(chǎn)生的。廣義上,用戶的行為數(shù)據(jù),各種傳感器的數(shù)據(jù),也都是“眾包”的形式,只要是由過去集中式的產(chǎn)生模式擴散到分布式的模式,都是眾包的形式。嚴(yán)謹(jǐn)一點來說,眾包指的是一個公司或機構(gòu)把過去由員工執(zhí)行的工作任務(wù),以自由自愿的形式外包給非特定的大眾網(wǎng)絡(luò)的做法。
二、通過“全量數(shù)據(jù)挖掘”獲知“真相”
這些數(shù)據(jù)不是通過采樣得來的,就是真真切切的“全量數(shù)據(jù)”。我們再也不用通過“管中窺豹”的形式來推測全局,而是直接通過“上帝視角”來窺視真相。這就是大數(shù)據(jù)的魅力,我們獲得了獲取真相的能力,而且對于大型互聯(lián)網(wǎng)公司來說,即使是PB級別的數(shù)據(jù)分析也是準(zhǔn)實時的,我們下一個小時就能夠得知上一個小時的全量數(shù)據(jù)分析結(jié)果,這樣的能力是從來沒有的。