数据挖掘

  • Sensors Data创始人桑文锋:初创公司构建数据分析平台

    摘要:初创公司在数据分析方面有哪些错误的认识?初创公司如何实现数据驱动?如何从零搭建数据分析平台?如何规范数据?如何数据建模?如何构建查询分析平台?在数据分析平台建设上,有哪些关键问题? 本演讲希望为你打通任督二脉。演讲的主要内容包括:对数据驱动,有哪些是是而非的认识?理想状态又是如何?现有常用方案剖析,有哪些优势及不足; 推荐的一套方案,包括数据的采集、传…

    2016-02-23
    0
  • Salesforce 收购 PredictionIO,加强自身机器学习和数据挖掘能力

    Salesforce 正式对外宣布收购 PredictionIO,用于增强自己在机器学习和大数据分析方面的能力。 Prediction IO 于 500 Satrtups 毕业,在 2014年 拿到了 250 万美元的种子轮融资,投资人包括投资了 VMWare 的 Azure Capital,StartX 基金等。 其 CEO 兼创始人 Simon Chen…

    2016-02-22
    0
  • 大嘴巴漫谈数据挖掘:深入评价需定量,问卷测试评分项

    通过定性研究,深入了解用户的产品使用行为、探索归纳出使用过程中遇到的障碍和问题,并对这些问题作出详细合理的解释,为随后的定量分析做准备。 结合定性研究总结出的主要问题,定量分析通过结构化的问卷调研了解用户的行为特征,如用户下载安装、使用地点、使用频率,以及对产品功能、价格和名称等方面的评价,并进行量化确认。 定量分析中,一般会借助电话访问结合问卷调研来获取用…

    2016-02-22
    0
  • 国内云计算服务竞品分析

    摘要:据NIST(美国国家标准与技术研究院)的权威定义,云计算的服务模式分为IaaS,PaaS和SaaS。未来云计算的规模依旧会保持高速增长,原因有二:1).智慧城市、工业4.0的普及会促进互联网数据中心(IDC)和云服务整体规模的增长。2).由于公有云的部署方便,价格低廉,互联网数据中心(IDC)用户转型公有云的趋势明显。 1.行业背景 1.1.市场背景:…

    2016-02-22
    0
  • 2016互联网数据分析人才高度稀缺

    当前中国互联网行业正呈现一片火爆之势,不仅依托互联网 战略成为了推动各行业创新的支柱行业,更形成了巨头大放异彩,各家百花争鸣的火热格局。因此,互联网行业也成为了炙手可热的人才聚集地。 2月4日,从全球最大的职业社交平台领英获悉,目前研发工程师、产品经理、人力资源、市场营销、运营和数据分析这六大职位是互联网行业需求最火热的。 数据分析人才高度稀缺 2月4日,领…

    2016-02-21
    0
  • 整天看用户埋点数据,知道数据是咋来的吗?

    摘要:我们平时看到的报表复杂而多样,能够通过多种纬度的数据评估用户的使用习惯和对应功能的价值。然而这些报表是如何产生的呢今天咱们就看看上报数据一步一步变成报表的大致流程。 所有上报的数据都是为了记录一次事件的发生或者描述一个状态,具体的上报数据可以设计为KEY-VALUE的形式或者数据组合的形式。KEY-VALUE的形式主要用来统计简单的计数类上报,如按钮点…

    2016-02-21
    0
  • 数据挖掘的常用方法、功能和一个聚类分析应用案例

    摘要:笔者整理了数据挖掘的常用方法和数据挖掘的重要功能(出自MBA智库百科)。当然,横看成岭侧成峰,这些常用方法和重要功能也许并不完全正确或完整。除此以外,笔者尝试学习了SMARTBI公司中的Smart Mining软件,并跟随其提供的示例教程进行了学习。为方便阅读,将其示例教程结合自己的体会作为文章的第三部分。 一、数据挖掘的常用方法 利用数据挖掘进行数据…

    2016-02-20
    0
  • 当我们被数字吞噬:行为痕迹和智能生活

    这是一个被数字吞噬的时代。互联网大行其道、智能手机普及、智能硬件发展、存储技术进步、硬件成本下降,这些要素都推进了信息和数据爆炸性增长的趋势。2000年以前,人类仅存储大约12 EB的数据。但是,现如今,每天都将会产生大约2EB的数据。换言之,过去两年内人类社会的数据增长量占到全世界所有数据的百分之九十以上。数字不吞噬你,吞噬谁 这也是一个傲娇和浮夸的时代。…

    2016-02-20
    0
  • 如何判断一笔交易是否属于欺诈 数据挖掘算法与现实生活中的应用案例

    “如何分辨出垃圾邮件”、“如何判断一笔交易是否属于欺诈”、“如何判断红酒的品质和档次”、“扫描王是如何做到文字识别的”、“如何判断佚名的著作是否出自某位名家之手”、“如何判断一个细胞是否属于肿瘤细胞”等等,这些问题似乎都很专业,都不太好回答。但是,如果了解一点点数据挖掘(Data Mining)的知识,你,或许会有柳暗花明的感觉。 的确,数据挖掘无处不在。它…

    2016-02-18
    0
  • 如何建立时间序列预测模型?

    1. 背景 先来看两个例子,下面两幅图展示了百度在趋势预测方面的应用案例,一个是世界杯期间的比赛输赢预测,另一个是北京各旅游景区的游客人数预测。 这两幅图代表了大数据环境下趋势预测的典型场景,即事件预测和时序预测,本文重点关注第二幅图中的场景,即与时间维度相关的时间序列预测。 2. 时间序列预测 时间序列预测即以时间数列所能反映的社会经济现象的发展过程和规律…

    2016-02-08
    0
  • 大嘴巴漫谈数据挖掘:用户招募选样本,发现问题给建议

    下面通过一个实际产品例子来描述可用性测试的整个实施过程,即按照任务流程总结归纳某一电子书城网站的可用性问题,统计各个情境下可用性问题的出现和分布状况,发现高优先级的可用性问题并给出改进建议,以及根据测试结果列出衡量可用性问题的对比指标。其中的测试内容包括针对网站的注册,电子书的试读、购买和赠送。 用户招募是可用性测试中的一个重要环节,且具有一定难度。为了达到…

    2016-02-05
    0
  • 大嘴巴漫谈数据挖掘:试用产品商用前,定性研究分用户

    与可用性测试不同,接下来的试商用测试选取的是产品的真实用户,能够根据用户自发的业务使用行为,获取更为客观且具有实际参考意义的用户反馈,并在产品正式投放市场前尽可能多地修正发现的问题。但有时与最终上市产品相比,在某些方面还会有一定程度的限制,比如使用场所、订购渠道等。 产品试商用时,测试研究通常需要测试用户对产品进行综合评价,汇总产品各个方面的用户反馈信息,一…

    2016-02-05
    0
  • 大嘴巴漫谈数据挖掘:结果分析看指标,完成时间完成率

    在用户数据统计分析中,指标任务完成率和任务完成时间意指根据产品实际情况积累出的参考值,从而作为横向比较指标。通常会将所有任务的任务完成率取平均值,则可得到针对某项产品的平均任务完成率,同理也可得到平均任务完成时间。如上所示,在情境1的任务1.1里,有10%的测试用户未完成任务;有5人的任务完成时间小于平均值,4人的任务完成时间大于平均值。 如上所示,在不同的…

    2016-02-04
    0
  • 大嘴巴漫谈数据挖掘:产品商用需测试,可用测试验原型

    第四时期产品测试是在新产品开发完成以后,为了获取用户对产品的功能、性能等方面的评价,通常会事先邀请符合目标用户特征的潜在用户试用该产品,以便进一步完善和改进产品。 产品测试包括可用性测试和试商用两个步骤。可用性测试意指通过检测产品原型的可用性,来了解用户使用产品的具体情况。试商用则是指将完成可用性测试的新产品小范围投入市场,提供给真实用户使用及体验。 一般来…

    2016-02-03
    0
  • 大嘴巴漫谈数据挖掘:卡片分类排架构,开放聚合按距离

    卡片分类法选择结构设计的最终使用者作为目标用户。用户数量可以根据卡片数量的多少来确定,在没有特别要求的情况下,一般建议15人左右为宜。首先将待分类的内容用一句总结性的语言进行概括描述,然后做成卡片的形式,卡片正面描述分类内容,背面显示标记序号,便于后续统计分析。 如前所述,封闭式卡片分类法最初类别已定,对于某一卡片,用户投入最多选择比例的类别即为该卡片的所属…

    2016-02-01
    0
关注我们
关注我们
分享本页
返回顶部