大数据技术
-
实现数据科学研究结果可复制的十条规则
近年来,有越来越多的迹象表明,科研结果的可复现性出现了危机。对心理学和癌症生物学论文的检查发现,分别只有40%和10%的结果是可复现的。
-
如何快速全面建立自己的大数据知识体系?
很多人都看过不同类型的书,也接触过很多有关大数据方面的文章,但都是很零散不成系统,对自己也没有起到多大的作用,所以作者第一时间,带大家从整体体系思路上,了解大数据产品设计架构和技术策略。
-
实现数据统一的七大原则
数据统一可以说是数据分析领域的一个长期挑战。虽然联合式的方法获得了一些青睐,但绝大部分的数据分析从业者希望在分析之前,所有数据都能在同一个地方呈现出来。这意味着,来自不同实体的数据必须统一起来,而问题就出在这个地方。
-
如何校验用户画像的准确性?
用户画像是数据运营的基础,也是做深度挖掘的一个不可或缺的模块。只有先打好画像基础,确保画像质量,后续的深挖行为才有突破的可能。
-
科大讯飞 谭昶:大数据的实践与思考
科大讯飞 谭昶:大数据的实践与思考。2016中国大数据技术大会中,上来自科大讯飞大数据研究院副院长谭昶,他带来了《讯飞大数据的实践与思考》的……
-
2017年6大热门开源项目
2017 年哪些开源项目值得关注?让我们来看看 2017 年的 6 大热门开源项目。
-
T级数据量下的划分聚类方法CLARANS+
如何在大量数据量下,简单快速的寻找到最优中心点的过程
-
Hadoop Yarn调度器的选择和使用
Yarn在Hadoop的生态系统中担任了资源管理和任务调度的角色。
-
推荐系统主要算法总结及Youtube深度学习推荐算法实例概括
现如今,许多公司使用大数据来做超级相关推荐,并以此来增加收益。在海量推荐算法中,数据科学家需要根据商业限制以及需求来选择最佳算法。为使其简单化,Statsbot 团队为现有的主要推荐系统算法准备了一份概述。
-
基于统计思想下的推荐系统
基于威尔逊区间法的排序方法
-
关于推荐算法的一些思考
最近做了一个交叉销售的项目,梳理了一些关键点,分享出来希望对大家有所启发
-
为什么你统计 PV 的方式是错的?
合格的工程师要能认识到数据和功能一样重要,因为准确的数据收集是产品迭代、市场营销的决策基础。
-
Countly市场经理陈俊勋:助你所在团队走上大数据路途的六大规则
由于“大数据”的热点集中和可以处理海量数据如大规模并行计算(massively parallel computing)、云计算、Hadoop和MapReduce。因此,Oracle、IBM、微软、SAP和其他大厂家目前共同在推动相关对话。
-
从底层到应用,那些数据人的必备技能
谨以此文献给对数据有热情,想长期从事此行业的年轻人,希望对你们有所启发,并快速调整思路和方向,让自己的职业生涯有更好的发展。
-
外卖O2O的用户画像实践
外卖的用户画像的实践和经验累积,必将对整个电商领域的大数据应用作出新的贡献!