聚类分析

  • 数据挖掘算法:K 均值算法

    摘要:均值算法是一种典型的无监督学习算法,用来对数据进行分类。 聚类问题 Clustering 针对监督式学习,输入数据为 (x, y) ,目标是找出分类边界,即对新的数据进行分类。而无监督式学习只给出一组数据集 ${x_1, x_2, … , x_m}$ ,目标是去找出这组数据的模式特征,比如哪些数据是一种类型的,哪些数据是另外一种类型的。典型…

    2015-12-16
    0
  • 数据分析系列篇:数据分析方法论

    掌握了excel、spss、sas、r这些分析工具之后,我们来了解下数据分析的基本方法论,其实数据分析方法不复杂,我们需要把一些核心的分析方法掌握了活学活用。 重点包括两块,一块是统计分析方法论:描述统计、假设检验、相关分析、方差分析、回归分析、聚类分析、判别分析、主成分与因子分析、时间序列分析、决策树等; 一块是营销管理常用分析方法论:SWOT、4P、PE…

    2015-12-06
    1
  • 用SPSS进行聚类分析:变量筛选的一套方法

    聚类分析是常见的数据分析方法之一,主要用于市场细分、用户细分等领域。利用SPSS进行聚类分析时,用于参与聚类的变量决定了聚类的结果,无关变量有时会引起严重的错分,因此,筛选有效的聚类变量至关重要。 案例数据源: 在SPSS自带数据文件plastic.sav中记录了20中塑料的三个特征,分别是tear_res(抗拉力)、gloss(光滑度)、opacity(透…

    2015-12-03
    0
  • 用SPSS进行聚类分析的案例—某移动公司客户细分模型

    聚类分析在各行各业应用十分常见,而顾客细分是其最常见的分析需求,顾客细分总是和聚类分析挂在一起。 顾客细分,关键问题是找出顾客的特征,一般可从顾客自然特征和消费行为入手,在大型统计分析工具出现之前,主要是通过两种方式进行“分群别类”,第一种,用单一变量进行划段分组,比如,以消费频率变量细分,即将该变量划分为几个段,高频客户、中频客户、低频客户,这样的状况;第…

    2015-11-29
    0
  • 如何通过自学,成为数据挖掘“高手”?

    摘要:如何成为数据挖掘“高手”?先把最基础的概念操作学好,之后还要多参与实际项目,数据挖掘能力只能在项目实践的熔炉中提升、升华,所以跟着项目学挖掘是最有效的捷径。

    2015-11-07
    0
  • 数据挖掘之七种常用的方法

    利用数据挖掘进行数据分析常用的方法主要有分类、回归分析、聚类、关联规则、特征、变化和偏差分析、Web页挖掘等, 它们分别从不同的角度对数据进行挖掘。

    2015-11-02
    0
  • 教你怎么看聚类分析的树状图

    之前有群友问,用聚类分析得到的树状图,怎么看? 简单讲一下: 有下面这样的一个树状图 继续往左走,在出现第三条横线的时候,竖着切一刀 这样我们就把样本划分为3类 第一类:中国 第二类:日本和菲律宾 第三类:其他 你可以一直往左分,一直到1个样本一个群,看你自己的需求,分多少类,你自己做主,最主要是类的特征显著、具备可解释性。

    2015-11-01
    0
  • 数据小兵:SPSS聚类分析过程解析

    SPSS手把手的教程案例不错,数据小兵是一个专注SPSS研究的博客,里面涉及SPSS各种经典分析方法的实际操作过程解析。今天给大家推荐的是《利用SPSS进行聚类分析的过程》。 案例过程涉及到spss层次聚类中的Q型聚类和R型聚类,单因素方差分析,Means过程等,是一个很不错的多种分析方法联合使用的聚类分析案例。 案例数据源:有20种12盎司啤酒成分和价格的…

    2015-10-30
    0
  • 数据挖掘的聚类算法有哪些,各有什么优势?

    比较分类算法的话,大概考虑这几个维度:时间空间复杂度,鲁棒性,参数敏感性,处理不规则形状,适合的类数量,类间差异(范围大小,样本个数,形状差异) 可以参照一下sklearn网站给出的列表:2.3. Clustering 除了这些聚类方法以外,统计老师讲过一些传统的聚类方法,归属于系统聚类的范畴,先定义观测间的距离和类之间的距离计算方法,然后按照距离把最接近的…

    2015-10-24
    0
  • 面向程序员的数据挖掘指南8:聚类分析

    前几章我们学习了如何构建分类系统,使用的是已经标记好类别的数据集进行训练: 训练完成后我们就可以用来预测了:这个人看起来像是篮球运动员,那个人可能是练体操的;这个人三年内不会患有糖尿病。 可以看到,分类器在训练阶段就已经知道各个类别的名称了。那如果我们不知道呢如何构建一个能够自动对数据进行分组的系统比如有1000人,每人有20个特征,我想把这些人分为若干个组…

    2015-05-08
    0
  • 数据挖掘化功大法(2)——挖掘模式

    数据模式包括:特征化与区分、频繁模式、关联和相关性挖掘、分类与回归、聚类分析、离群点分析等。 任务可以分为两类:描述性和预测性数据。 数据特征化:汇总所研究类的数据。 数据区分:将目标类一个或多个可比较类进行比较。 频繁模式挖掘、关联和相关性: 频繁模式(Frequent Pattern)是频繁出现在数据集中的模式(如项集,子序列和子结构)。频繁模式一般可以…

    2015-01-02
    0
  • 数据挖掘入门基础知识介绍

    数据挖掘技术的基本概念。

    2013-04-18
    0
关注我们
关注我们
分享本页
返回顶部