美文网首页大数据笔记
Hive 4.1 - 虚拟列

Hive 4.1 - 虚拟列

作者: No_七 | 来源:发表于2019-10-25 15:45 被阅读0次

虚拟列:此列不在表中真实存在,作用是将Hive中的表进行区分(partition),这对每日增长的海量数据而言是非常有用的。

1、INPUT__FILE__NAME 显示数据存储在HDFS上的位置

用法:

hive (db02)> select *,INPUT__FILE__NAME from s1;
image.png

2、BLOCK__OFFSET__INSIDE__FILE, 显示数据块的大小

hive (db02)> select * , BLOCK__OFFSET__INSIDE__FILE from s1;
image.png

相关文章

  • Hive 4.1 - 虚拟列

    虚拟列:此列不在表中真实存在,作用是将Hive中的表进行区分(partition),这对每日增长的海量数据而言是非...

  • hive虚拟列

    火山日常啰嗦 讲讲hive的小知识点--虚拟列 hive虚拟列有两种: 1)INPUT__FILE__NAME 输...

  • Hive 分区/分桶

    分区/桶 Hive 分区 Hive的分区方式:由于Hive实际上是数据文件在HDFS存在的目录区分分区字段是虚拟列...

  • Hive优化

    hive.optimize.cp=true:列裁剪 hive.optimize.prunner:分区裁剪 hive...

  • 5.Hive其他知识点

    5.1Hive Lateral View 5.2Hive 视图 查询到的数据放在一张虚拟表中; 5.3Hive 索...

  • 大数据开发之Hive篇13-Hive的索引

    备注:Hive 版本 2.1.1 一.Hive索引简介 Hive索引的目标是提高对表的某些列进行查询查找的速度。如...

  • Hive增加列结果为NULL

    Hive增加列结果为NULL 1. 问题描述 hive表使用 ALTER TABLE search_index.m...

  • Hive-索引

    简介 Hive从0.7.0版本开始加入了索引,目的是提高Hive表指定列的查询速度。没有索引的时候,Hive在执行...

  • MySQL利用虚拟列优化

    链接 eg1.5.7利用虚拟列优化 eg2.虚拟列优化2

  • CSV文件操作(二)

    练习4 选取特定的列 4.1 保留数据的第一列和最后一列 4.1.2 csv模块 4.1.3 使用pandas...

网友评论

    本文标题:Hive 4.1 - 虚拟列

    本文链接:https://www.haomeiwen.com/subject/rawsvctx.html