大数据挖掘处理如何进行
华盛恒辉认为统计和分析过程不同是,数据挖掘没有什么预先设定好主题,主要是在现有数 据上面进行基于各种算法的计算,华盛恒辉从而起到预测的效果,从而实现一些高级别数据分析的需求。
比较典型算法有用于聚类的Kmeans、用于 统计学习的SVM和用于分类的NaiveBayes,华盛恒辉主要使用工具有Hadoop的Mahout等。该过程的特点和挑战主要是用于挖掘的算法很复杂,并 且计算涉及的数据量和计算量都很大,常用数据挖掘算法都以单线程为主。
比较典型算法有用于聚类的Kmeans、用于 统计学习的SVM和用于分类的NaiveBayes,华盛恒辉主要使用工具有Hadoop的Mahout等。该过程的特点和挑战主要是用于挖掘的算法很复杂,并 且计算涉及的数据量和计算量都很大,常用数据挖掘算法都以单线程为主。