app开发
一、通过“众包”产生和收集数据
高德地图、地图都有实时路况的功能,但大家有没有想过实时路况的数据是怎么收集的?实际上经过了三个阶段,开始是跟交通口的一些公司合作,获取交通流量监测设备的数据,这个方法缺陷很明显,一个是受制于人,一个是想扩大监测范围就要部署大量设备,费时费力,而且还受法律制约。于是一些专门做路况的公司开始用出租车当浮动车收集数据。但这种办法还是无法覆盖大量的大小路段,随着移动互联网的普及,高德地图的APP能够实时上传大量机动车的速度和位置信息,经过去噪和综合分析,就形成了覆盖率极高的实时路况信息。这就是一个典型的“众包”过程。
大数据的“海量数据”就是由“众包”产生的。广义上,用户的行为数据,各种传感器的数据,也都是“众包”的形式,只要是由过去集中式的产生模式扩散到分布式的模式,都是众包的形式。严谨一点来说,众包指的是一个公司或机构把过去由员工执行的工作任务,以自由自愿的形式外包给非特定的大众网络的做法。
二、通过“全量数据挖掘”获知“真相”
这些数据不是通过采样得来的,就是真真切切的“全量数据”。我们再也不用通过“管中窥豹”的形式来推测全局,而是直接通过“上帝视角”来窥视真相。这就是大数据的魅力,我们获得了获取真相的能力,而且对于大型互联网公司来说,即使是PB级别的数据分析也是准实时的,我们下一个小时就能够得知上一个小时的全量数据分析结果,这样的能力是从来没有的。