《Hadoop大数据》专题

专题列表页

大数据相关的学习记录

hive的高阶函数
9
2019-05-21

问题： 1，如果让你计算5月21号这个日期前3天到后面3天的数据和？（不只是5月21号这一天，所有天的前3天加上后...[作者空间]

用HiveQL计算连续天数问题的方法
47
2019-05-13

昨晚简书服务器可能出了什么bug，文章发布出去都会变成完全空白。没办法，只能断更一天，放在今天发了，大概能达到十万...[作者空间]

数仓--Hive-面试之Hive优化策略
89
2019-05-10

Hive的优化策略大致分为：配置优化(hive-site.xml和hive-cli执行前配置)、表优化、hive数...[作者空间]

数仓--Hive-面试之Hive的数据模型及各模块的应用场景
151
2019-05-09

这个讲起来搞不好让手写代码，扩展延申的问 Hive的数据模型数据模型组成及应用场景 Hive的数据模型主要有：d...[作者空间]

再不懂ZooKeeper，就安安心心把这篇文章看完
15
2019-05-07

我本人曾经使用过 ZooKeeper 作为 Dubbo 的注册中心，另外在搭建 Solr 集群的时候，我使用到了 ...[作者空间]

HDFS中的HA原理解析
4
2019-05-06

前言Hadoop2.0之前，NameNode是单个集群的故障点，NameNode作为集群首脑，存放着集群中所有的元...[作者空间]

搭建本地hadoop集群（虚拟机）
26
2019-05-03

1.搭建虚拟机环境创建三个虚拟机，网络以桥接模式，三台虚拟机在同一网段，保证三台机器能够相互ping通。 1.1...[作者空间]

Hive平滑过渡到Spark Sql
1
2019-05-13

Hive概述 Hive 是基于 Hadoop 的一个数据仓库工具，可以将结构化的数据文件映射为一张数据库表，并提供...[作者空间]

Hive的UDF、UDAF、UDTF定义及UDF Demo
35
2019-04-27

1）Hive 自带了一些函数，比如：max/min等，但是数量有限，自己可以通过自定义UDF来方便的扩展。2）当H...[作者空间]

Kafka如何实现每秒上百万的超高并发写入？掌握好面试给你打满分
5
2019-04-27

这篇文章来聊一下 Kafka 的一些架构设计原理，这也是互联网公司面试时非常高频的技术考点。 Kafka 是高吞吐...[作者空间]

面试必备技能-HiveSQL优化
90
2019-04-27

Hive SQL基本上适用大数据领域离线数据处理的大部分场景。Hive SQL的优化也是我们必须掌握的技能，而且，...[作者空间]

数仓--DW--Hadoop数仓实践Case-16-迟到的事实
63
2019-04-17

迟到的事实概述数据仓库通常建立于一种理想的假设情况下，这就是数据仓库的度量（事实记录）与度量的环境（维度记录...[作者空间]

Apache Hbase
65
2019-04-17

作者：jiangzz 电话：15652034180 微信：jiangzz_wx 微信公众账号：jiangzz_wy...[作者空间]

数仓--DW--Hadoop数仓实践Case-08-退化维度
79
2019-04-16

退化维度概述退化维度，该技术减少维度的数量，简化维度数据仓库模式。简单的模式比复杂的更容易理解，也有更好的...[作者空间]

全面解析基于Hadoop模型的数据分析平台框架
2
2019-04-10

本文主要讲解以下两个方面： ♦Hadoop MapReduce与Hive技术研究 ♦数据分析平台框架设计与环境配置...[作者空间]

Hadoop3.2 集群搭建
61
2019-04-02

Hadoop3.2 集群新版本的搭建详细讲解过程，从下面第一张官方的图来看，最新版是3.2，所以大猪将使用3.2的...[作者空间]

利用Binlog和Kafka实时同步mysql数据到Elasti
35
2019-03-20

目录 1、利用Binlog和Kafka实时同步mysql数据到Elasticsearch(一) - 开启Binlo...[作者空间]

spark SQL 教程
9
2019-03-12

一、什么是Spark SQL Spark SQL是Spark用来处理结构化数据的一个模块，它提供了两个编程抽象分别...[作者空间]

Kafka史上最详细原理总结下
13
2019-02-28

Kafka史上最详细原理总结分为上下两部分，承上启下 Kafka史上最详细原理总结上 Kafka史上最详细原理总结...[作者空间]

spark学习笔记1-基础部分
104
2019-02-27

本文是对Spark基础知识的一个学习总结，包含如下几部分的内容：概述运行模式 Spark Shell RDD/...[作者空间]

栏目导航

延伸阅读

栏目导航

爱情美文推荐

热点爱情美文

最新爱情美文