什么是大数据?
大数据顾名思义就是数据量很大,大到什么级别吗?它不是几兆,不是几个GB,而是几百GB,几个TB,几个PB,达到传统的数据库根本承受不了,现在一般都是用Hadoop技术,Hive技术,Spark技术等处理。
那么大数据的特征有哪些呢?有4点
1.数据在体量方面很大,比如说文字,有各种各样的来源,有电子书|实体书|杂志|报刊等,它们的数据大吧。
2.数据的类型多种多样,有些是结构化的数据,像存在Oracle,MySQL这些传统的数据库里的数据,一般都是结构化,可 以是还有非结构化,比如HTML,WORD,execl等格式。
3.它们的价值密度低,这样说吧,你比如说观看一条数据好像价值也不大,但是分析所有的数据之后呢?总会挖掘出一些 重要的东西。
大数据的特征
4.处理这些数据的速度要快。比如像Hadoop技术的MapReduce计算框架,相比传统的数据库处理速度要快,它的吞吐量 特别的大,再比如Spark,Spark在内存方面计算比Hadoop快100倍,在磁盘方面计算快10倍。
大数据的处理与传统的数据处理的区别是什么呢?
就是使用全部的数据来分析,得出结论,想想就知道它的好处啦。
大数据的应用?
可以做推荐系统的,想电商、影视类的app,你平时关注什么商品,或者浏览什么类型的商品,或者看什么类型的影视,或者看谁主要的影视,经过大数据分析处理之后,这些app就会推荐想类似的商品或者影视
在销售方面,我想一个例子大家都听说过,就是尿片和啤酒的捆绑销售
银行方面的反欺诈应用。经过大量的数据分析,可以得出欺诈的行为特征,根据这些特征就可以更大概率的确定是不是欺诈行为
人工智能方面,想Google的阿尔法狗,无人汽车驾驶等,这些都在使用大数据。