SQL
-
携程酒店排序推荐广告高效可靠数据基座–填充引擎
携程酒店排序推荐广告工程(以下简称酒店推荐工程)在数据层面引入抽象化的统一数据协议UnifiedPB,解决了过去各场景各自维护,建立各自的数据流,网状开放式数据表,烟囱式迭代的问题,实现了全场景数据的标准化、规范化、统一化。
-
Python数据分析,学习路径拆解及资源推荐
关于Python数据分析,其实网上能够找到的学习资源很多,主要分为两类:一类是提供各种资源的推荐,比如书单、教程、以及学习的先后顺序;另一类是提供具体的学习内容,知识点或实际案例。
-
3000字!5大SQL数据清洗方法!
公司的业务数据一般存储在数据仓库里面,数据量很大,主要用的是HiveSQL和MySql做处理。 基于此,写了一个常用数据清洗的SQL对比版,脚本很简单,重点是这些清洗场景和逻辑,大纲如图: 1、…
-
漫谈数据仓库之拉链表(原理、设计以及在Hive中的实现)
本文将会谈一谈在数据仓库中拉链表相关的内容,包括它的原理、设计、以及在我们大数据场景下的实现方式。
-
SQL面试通关秘籍:面试知识点+技巧分享!
在这篇文章中,我将介绍 SQL 面试问题中常见的模式,并提供一些在 SQL 查询中巧妙处理它们的技巧。
-
Hive SQL迁移Spark SQL在网易传媒的实践
在整个迁移过程,除了前期踩坑阶段,期间线上基本没出什么问题,十分平滑的将2000左右的任务迁移到了sparkSql,而且也没耗费过多人力,这说明整个迁移方案的设计和实施是比较成功的。
-
数据分析,你逃不掉的几大「坑」
作者:瑶子 今天想写的主题是:数据分析 ,我一直觉得这属于很多人不知道Ta有多重要、一部分人知道Ta重要但并不重视,只有极少数人真正在工作中重视Ta并且运用Ta。 说一个东西重要,肯定要讲为什么,不然绝对是要被拿着刀追几条街的。 那么,数据分析为什么重要呢?至少有以下好处: 相比“似乎”、“好像”,能够更加客观的呈现真实现状;相比“我以为”、“我觉得”,数据…
-
Facebook提出全新交互式语义分析框架,自然语言生成SQL语句准确率提升10%
交互式语义分析是最近的研究热点,通过与用户的交互提升语义理解的准确性。
-
网易数据运河系统NDC设计与应用
NDC是网易近一年新诞生的结构化数据传输服务,它整合了网易过去在数据传输领域的各种工具和经验,将单机数据库、分布式数据库、OLAP系统以及下游应用通过数据链路串在一起。
-
阿里新一代计算引擎Blink与SQL和机器学习的二三事
随着大数据技术的不断发展和成熟,无论是传统企业还是互联网公司都已经不再满足于离线批处理,实时流处理的需求和重要性日益增长。
-
如何从MongoDB迁移到MySQL?这有现成经验!
如何从MongoDB迁移到MySQL?这有现成经验!
-
用于构建优秀命令行的4个Python库
在本文中,我将介绍如何在几个库的帮助下,在 Python 中实现这些功能。读完后,读者会了解到如何使用 Prompt Toolkit, Click(命令行界面创建工具包)、Pygments 和 Fuzzy Finder 来实现一个易于使用的 REPL。
-
MySQL进行Replace操作时造成数据丢失
MySQL进行Replace操作时造成数据丢失。
-
教你如何零基础快速入门SQL
这篇主要是针对一些从来没有接触过的sql小白,算是科普一下,具体想要更深入学习sql的。
-
面试了57位数据分析师,我发现牛逼的人都有这4个特质
要当一名“高级”数据分析师,一直吃老本是不可能的。只有不断学习不断思考才能做到顶尖。