大数据技术
-
2023 年值得关注的 7 大数据质量趋势
要发挥作用,数据必须准确、完整、有效、唯一并且按照标准化格式进行结构化。
-
终于有人把网络爬虫讲明白了
人们正在以前所未有的速度转向互联网,我们在互联网上所做的很多行为产生了大量的“用户数据”,比如微博、购买记录等。
-
大数据时代:十大最热门的大数据技术
随着大数据分析市场快速渗透到各行各业,哪些大数据技术是刚需?哪些技术有极大的潜在价值?根据弗雷斯特研究公司发布的指数,这里给出最热的十个大数据技术。
-
你的房东可能正用AI筛查你的犯罪记录,决定要不要租房给你
这个工具由CoreLogic提供,这是位于加利福尼亚州尔湾市的一家公司,据官网消息,其为所有房东、政府、抵押公司提供财务、财产和消费者信息,并且可以提供分析和商业智能。
-
企业数据质量管理核心要素和技术原则
数据质量管理的三个要素数据质量管理的技术关键点数据质量管理实战
-
为什么说大数据一定会从ABC里最先掉队?
人工智能(AI),大数据(big data)和云计算(cloud computing)三大技术被认为是当今互联网争夺的关键点。而三大技术中中争议最多的在于大数据技术,被夸大的效果和局限性的应用,很可能会让大数据成为ABC三大技术中最先掉队的一个。
-
互联网高可用架构技术实践
作者:jihong10102006 一、什么是高可用 高可用HA(High Availability)是分布式系统架构设计中必须考虑的因素之一,它通常是指,通过设计减少系统不能提供服务的时间。 假设系统一直能够提供服务,我们说系统的可用性是100%。如果系统每运行100个时间单位,会有1个时间单位无法提供服务,我们说系统的可用性是99%。很多公司的高可用目标…
-
从Hadoop到Spark和Flink,大数据处理框架十年激荡发展史
本文将从大数据的基础特性开始,进而解释分而治之的处理思想,最后介绍一些流行的大数据技术和组件,读者能够通过本文了解大数据的概念、处理方法和流行技术。
-
Apache Kafka快速入门指南
Kafka是基于发布订阅的消息系统。最初起源于LinkedIn,于2011年成为开源Apache项目,然后于2012年成为Apache顶级项目。Kafka用Scala和Java编写,因其分布式可扩展架构及可持久化、高吞吐率特征而被广泛使用。
-
大数据知识图谱实战经验总结
作为数据科学家,我想把行业新的知识图谱总结并分享给技术专家们,让大数据知识真正转化为互联网生产力!
-
大数据将市场营销推向21世纪的7种方式
大数据正使市场营销推向21世纪。这就是它的与众不同之处,让产品更具市场价值。
-
那些“中漂”的欧洲科学家们
就近几年的科技发展水平来看,中国已逐步向科技大国迈进,这在提升中国在全球的科研影响力之余,也在一定程度上改变了全球科学人才流动背后的格局。
-
1.3万亿条数据查询如何做到毫秒级响应?
知乎,在古典中文中意为“你知道吗?”,它是中国的 Quora,一个问答网站,其中各种问题由用户社区创建,回答,编辑和组织。
-
如何做一个成功的大数据项目?
大数据项目,成功?失败?
-
大学开设的大数据专业,授予什么学位、有哪些核心课程?
大学开设的大数据专业,授予什么学位、有哪些核心课程?