问题: 1,如果让你计算5月21号这个日期前3天到后面3天的数据和?(不只是5月21号这一天,所有天的前3天加上后...[作者空间]
昨晚简书服务器可能出了什么bug,文章发布出去都会变成完全空白。没办法,只能断更一天,放在今天发了,大概能达到十万...[作者空间]
Hive的优化策略大致分为:配置优化(hive-site.xml和hive-cli执行前配置)、表优化、hive数...[作者空间]
这个讲起来搞不好让手写代码,扩展延申的问 Hive的数据模型 数据模型组成及应用场景 Hive的数据模型主要有:d...[作者空间]
我本人曾经使用过 ZooKeeper 作为 Dubbo 的注册中心,另外在搭建 Solr 集群的时候,我使用到了 ...[作者空间]
前言Hadoop2.0之前,NameNode是单个集群的故障点,NameNode作为集群首脑,存放着集群中所有的元...[作者空间]
1.搭建虚拟机环境 创建三个虚拟机,网络以桥接模式,三台虚拟机在同一网段,保证三台机器能够相互ping通。 1.1...[作者空间]
Hive概述 Hive 是基于 Hadoop 的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供...[作者空间]
1)Hive 自带了一些函数,比如:max/min等,但是数量有限,自己可以通过自定义UDF来方便的扩展。2)当H...[作者空间]
这篇文章来聊一下 Kafka 的一些架构设计原理,这也是互联网公司面试时非常高频的技术考点。 Kafka 是高吞吐...[作者空间]
Hive SQL基本上适用大数据领域离线数据处理的大部分场景。Hive SQL的优化也是我们必须掌握的技能,而且,...[作者空间]
迟到的事实概述 数据仓库通常建立于一种理想的假设情况下, 这就是数据仓库的度量(事实记录) 与度量的环境(维度记录...[作者空间]
作者:jiangzz 电话:15652034180 微信:jiangzz_wx 微信公众账号:jiangzz_wy...[作者空间]
退化维度概述 退化维度,该技术减少维度的数量, 简化维度数据仓库模式。 简单的模式比复杂的更容易理解, 也有更好的...[作者空间]
本文主要讲解以下两个方面: ♦Hadoop MapReduce与Hive技术研究 ♦数据分析平台框架设计与环境配置...[作者空间]
Hadoop3.2 集群新版本的搭建详细讲解过程,从下面第一张官方的图来看,最新版是3.2,所以大猪将使用3.2的...[作者空间]
目录 1、利用Binlog和Kafka实时同步mysql数据到Elasticsearch(一) - 开启Binlo...[作者空间]
一、什么是Spark SQL Spark SQL是Spark用来处理结构化数据的一个模块,它提供了两个编程抽象分别...[作者空间]
Kafka史上最详细原理总结分为上下两部分,承上启下 Kafka史上最详细原理总结上 Kafka史上最详细原理总结...[作者空间]
本文是对Spark基础知识的一个学习总结,包含如下几部分的内容: 概述 运行模式 Spark Shell RDD/...[作者空间]