大数据
-
携程酒店排序推荐广告高效可靠数据基座–填充引擎
携程酒店排序推荐广告工程(以下简称酒店推荐工程)在数据层面引入抽象化的统一数据协议UnifiedPB,解决了过去各场景各自维护,建立各自的数据流,网状开放式数据表,烟囱式迭代的问题,实现了全场景数据的标准化、规范化、统一化。
-
滴滴大数据成本治理实践
本文将分享滴滴在大数据成本治理方面的实践。
-
滴普科技Deepexi柏海峰:数据治理与大模型一体化实践
大模型落地到当前这个阶段,核心关注点还是领域大模型,而领域大模型落地的前提在于两点:需求端,对当前应用的降本增效以及新应用的探索;供给端,训练技术已经有较高的成熟度。
-
作为一名数据人,你真的了解OLTP和OLAP的区别吗?
一、定义的区别 OLTP(on-line transaction processing)翻译为联机事务处理, OLAP(On-Line Anal…
-
Sensor Tower:2022年3月全球热门移动游戏下载量TOP10
Sensor Tower 商店情报数据显示,Homa Games《Merge Master》(也被称为《Merge & Fight》),以2830万次下载,位列3月全球移动游戏下载榜榜首。
-
开源时间序列数据集整理
UCR时间序列数据集是时序领域的“Imagnet”,涵盖医疗/电力/地理等诸多领域,目前全量数据有128种。该项目提供了一个非常全面的数据获取渠道,包含各个细分领域的数据库资源,自然科学和社会科学的覆盖都很全…
-
大数据就业方向了解一下
随着大数据在国内的发展,大数据相关人才却出现了供不应求的状况,大数据分析师更是被媒体称为“未来最具发展潜力的职业之一”。那么,大数据的就业方向有哪些呢?我们该如何择业呢?
-
终于有人把网络爬虫讲明白了
人们正在以前所未有的速度转向互联网,我们在互联网上所做的很多行为产生了大量的“用户数据”,比如微博、购买记录等。
-
大数据时代:十大最热门的大数据技术
随着大数据分析市场快速渗透到各行各业,哪些大数据技术是刚需?哪些技术有极大的潜在价值?根据弗雷斯特研究公司发布的指数,这里给出最热的十个大数据技术。
-
携程利用自主研发的大数据风控系统有效识别、防范这些风险
目前携程利用自主研发的风控系统有效识别、防范这些风险。携程风控系统从零起步,经过五年的不断探索与创新,已经可以有效覆盖事前、事中、事后各个环节。
-
A/B测试系统设计
1、 什么是A/B测试 A/B 测试,简单来说,就是为同一个目标制定两个方案,让一部分用户使用 A 方案,另一部分用户使用 B 方案,记录下用户的使用情况,看哪个方案的效果更好,以便全面推广。 A/B 测试在有的公司又称为小流量测试或者灰度发布,原因: 一是为了统计新功能的效果; 二是为了在全流量上线前修复可能出现的BUG。 虽然在业务上的含义有所差异,但是…
-
Hadoop面试中6个常见的问题及答案
译者 | 码农网 – 小峰 你准备好面试了吗?呀,需要 Hadoop 的知识!!?不要慌!这里有一些可能会问到的问题以及你应该给出的答案。 Q1.什么是 Hadoop? Hadoop 是一个开源软件框架,用于存储大量数据,并发处理/查询在具有多个商用硬件(即低成本硬件)节点的集群上的那些数据。总之,Hadoop 包括以下内容: HDFS(Hadoop Dis…
-
用Spark机器学习数据流水线进行广告检测
在这篇文章中,我们Spark的其它机器学习API,名为Spark ML,如果要用数据流水线来开发大数据应用程序的话,这个是推荐的解决方案。
-
现代商业中大数据的价值体现在哪?
文 | 董飞 大数据最大的价值不是事后分析,而是预测和推荐我们可以看到”精准推荐”在电商中的运用,预测性分析成为大数据在零售业的主流。 服装网站Stitch Fix例子,在个性化推荐机制方面,大多数服装订购网站采用的都是用户提交身形、风格数据+编辑人工推荐的模式,Stitch Fix不一样的地方在于它还结合了机器算法推荐。这些顾客提供的身材比例,主观数据,加…
-
微服务架构下的分布式数据管理
作者:李晓春 中兴开发者社区 1.1 分布式数据管理之痛点 为了确保微服务之间松耦合,每个服务都有自己的数据库, 有的是关系型数据库(SQL),有的是非关系型数据库(NoSQL)。开发企业事务往往牵涉到多个服务,要想做到多个服务数据的一致性并非易事,同样,在多个服务之间进行数据查询也充满挑战。 我们以一个在线B2B商店为例,客户服务 包括了客户的各种信息,例…