数据挖掘

  • 数据挖掘:周期性分析SMCA算法简介

    摘要:周期性分析SMCA算法简介 算法介绍 以时间顺序挖掘周期性的模式(即周期性分析)是一种重要的数据挖掘方式,在以前的研究中我们假设每个时间点只发生一个事件,然而在这篇文章中我们研究一种更普遍的模式:即在每个时间点可以发生多个事件。 在这个算法中我们需要自己设置三个参数:min_rep, max_dis, global_rep。分别代表“一个有效序列的最小…

    2016-04-05
    0
  • 数字营销用户画像,与犯罪画像有哪些异曲同工之处?

    摘要:现在有很多人对数字营销领域的“用户画像”报以怀疑的态度,可是你们为什么又那么喜欢看《犯罪现场》、《犯罪心理》等电视了,你们一定不知道这些电影里用到的一种手法,叫“犯罪心理画像”,其实和数字营销领域的“用户画像”,异曲同工。不信看下面吧! 正文 提到用户画像,好多人都听说过这个词,最初大家对它的普遍印象大概就是: 收集用户信息把对你有用的信息归纳整理成,…

    2016-04-05
    0
  • R语言构建配对交易量化模型

    我们可以通过“统计套利”的方法,发现市场的无效性。

    2016-04-05
    0
  • 数据分析告诉你,Papi酱的广告应该值多少钱?

    2016年伴随网红这个词迅速蹿红,以及网红撬动资本时代到来,papi酱迅速走进资本圈视野,并开启了网红变现第一战:广告拍卖。外部盛传papi酱估值千万人民币的广告价值是否真如其所说?papi酱广告到底多少价值?用数据分析papi酱视频广告的价值。 一,papi酱媒体覆盖面及其构成1、papi酱累计播放量构成papi酱作为短视频领域的网红第一人,目前作品在腾讯…

    2016-04-05
    0
  • 【SAS宏】拼手气红包该怎么抢?让微信红包的随机算法来告诉你

    摘要:看到一篇讲微信拼手气红包算法的,又回想起今年抢红包屡败屡战,手气捉急,所以用SAS实现了一下抢红包算法,一探究竟。 推荐阅读:微信红包的随机算法是怎样实现的? 算法如下每个红包的金额在0.01和剩余平均值*2之间产生。 例如:发100块钱,总共10个红包,那么平均值应该是10块钱一个,那么第一个抢到红包的额度在0.01-20元之间随机确定。又当前面3个…

    2016-04-04
    0
  • SAS-EM 决策树操作案例

    摘要:决策树主要用来描述将数据划分为不同组的规则。第一条规则首先将整个数据集划分为不同大小的子集,然后将另外的规则应用在子数据集中,数据集不同相应的规则也不同,这样就形成第二层数据集的划分。一般来说,一个子数据集或者被继续划分或者单独形成一个分组。 1 预测模型案例概述 一家金融服务公司为客户提供房屋净值贷款。该公司在过去已经拓展了数千净值贷款服务。但是,在…

    2016-04-04
    0
  • 朴素贝叶斯分类和预测算法的原理及实现

    决策树和朴素贝叶斯是最常用的两种分类算法,本篇文章介绍朴素贝叶斯算法。贝叶斯定理是以英国数学家贝叶斯命名,用来解决两个条件概率之间的关系问题。简单的说就是在已知P(A|B)时如何获得P(B|A)的概率。朴素贝叶斯(Naive Bayes)假设特征P(A)在特定结果P(B)下是独立的。 1. 概率基础: 在开始介绍贝叶斯之前,先简单介绍下概率的基础知识。概率是…

    2016-04-04
    0
  • 一篇文章告诉你机器学习的发展史

    摘要:最近,我们听到了关于机器学习的很多新闻,这部分是由不断增长的需求和缺少数据科学家们所激发的。但像许多创新一样,机器学习并不是简单出现的 ,它至少发展了二十年。在这篇文章中,我们简要地回顾一下这段历史。 在成功地推出Unica系列营销自动化软件之前,这家公司的主要业务是通过特别关注神经网络进而进行预测分析。1995年,Unica介绍了Pattern Re…

    2016-04-04
    0
  • 一篇文章透彻解读聚类分析及案例实操

    摘要:本文主要是介绍一下SAS的聚类案例,希望大家都动手做一遍,很多问题只有在亲自动手的过程中才会有发现有收获有心得。这里重点拿常见的工具SAS+R语言+Python介绍! 1 聚类分析介绍 1.1 基本概念 聚类就是一种寻找数据之间一种内在结构的技术。聚类把全体数据实例组织成一些相似组,而这些相似组被称作聚类。处于相同聚类中的数据实例彼此相同,处于不同聚类…

    2016-04-02
    0
  • 推荐系统算法初探

    0. 序言 最近因为PAC平台自动化的需求,开始探坑推荐系统。这个乍一听去乐趣无穷的课题,对于算法大神们来说是这样的: 而对于刚接触这个领域的我来说,是这样的: 在深坑外围徘徊了一周后,我整理了一些推荐系统的基本概念以及一些有代表性的简单的算法,作为初探总结,也希望能抛砖引玉,给同样想入坑的伙伴们提供一些思路。 1、什么是推荐系统? 推荐系统是啥? 如果你是…

    2016-03-31
    0
  • 如何做数据分析挖掘—以电信行业为例

    摘要:本文以电信行业为例讲述如何做数据分析挖掘。 来源:豪研呓语

    2016-03-28
    1
  • 数据挖掘问答精选收藏

    1.现在有大数据、精准挖掘、人工智能等这么多概念及技术,它们之间的关系以及企业大数据实施的路线图应该是怎样的?来自用户 SmartMining 的回答: 大数据、数据挖掘、人工智能三者的关系可以简单的理解为:大数据是原材料,数据挖掘是加工厂,而人工智能是数据产品尤其是基于数据挖掘技术建立的专家系统的设计理念。 通过使用数据挖掘技术对大数据进行价值提取、加工,…

    2016-03-24
    0
  • 揭开大数据测试的神秘面纱

    一、前言 在大数据时代,数据挖掘,人工智能,机器学习这一系列高大上的技术应运而生,针对这一系列高大上的系统,测试同学如何参与其中,做好质量把控呢?与我们熟悉的测试套路又有何不同呢?欲知详情,请听笔者细细道来。 二、背景知识介绍 模式识别:是目的,就是通过计算机用数学技术方法来研究模式的自动处理和判读。 机器学习:是一种方法,是一类从数据中自动分析获得规律,并…

    2016-03-24
    0
  • 协同过滤推荐算法的原理及实现

    协同过滤推荐算法是诞生最早,并且较为著名的推荐算法。主要的功能是预测和推荐。算法通过对用户历史行为数据的挖掘发现用户的偏好,基于不同的偏好对用户进行群组划分并推荐品味相似的商品。协同过滤推荐算法分为两类,分别是基于用户的协同过滤算法(user-based collaboratIve filtering),和基于物品的协同过滤算法(item-based col…

    2016-03-23
    0
  • 决策树分类和预测算法的原理及实现

    摘要:决策树是一种通过对历史数据进行测算实现对新数据进行分类和预测的算法。简单来说决策树算法就是通过对已有明确结果的历史数据进行分析,寻找数据中的特征。并以此为依据对新产生的数据结果进行预测。 决策树由3个主要部分组成,分别为决策节点,分支,和叶子节点。其中决策树最顶部的决策节点是根决策节点。每一个分支都有一个新的决策节点。决策节点下面是叶子节点。每个决策节…

    2016-03-21
    1
关注我们
关注我们
分享本页
返回顶部