美文网首页
「大数据」04大数据框架:Lambda Architecture

「大数据」04大数据框架:Lambda Architecture

作者: 林拂晓 | 来源:发表于2020-02-15 19:19 被阅读0次

1.LA框架的提出

    最早由Twitter工程师Nathan Marz提出来,它是一种大数据软件设计架构,其目的是指导用户充分利用批处理和流式计算技术各自的优点,在延迟、吞吐量和容错之间找到平衡点,实现一个复杂的大数据处理系统。

2.主要思想

LA的主要思想是将数据处理流程分解成三层:批处理层、流式处理层和服务层。

LA框架的主要思想

(1)批处理层。它的主要思想是利用分布式批处理计算,以批为单位处理数据,并产生一个经预计算产生的只读数据视图。该层将数据流看成只读的、仅支持追加操作的超大数据集。它可以一次性处理大量数据,引入复杂的计算逻辑(比如机器学习中的模型迭代计算,历史库的匹配等),其优点是吞吐率高,缺点是数据处理延迟高,即从数据产生到最终被处理完成,整个过程用时较长,通常是分钟或小时级别。

(2)流式处理层。为了降低批处理层带来的高延迟,LA又引入了流式处理层,该层采用流式计算技术,大大降低了数据处理延迟(通常是毫秒或秒级别),其优点是数据处理延迟低,缺点是无法进行复杂的逻辑计算,得到的结果往往是近似解。

(3)服务层。批处理层和流式处理层可以结合在一起,这样既保证数据延迟低,也能完成复杂的逻辑计算(只能保证最终一致性)。为了整合两层的计算结果,LA进一步引入服务层,它对外提供了统一的访问接口以方便用户使用。

文章内容整理于:董西成《大数据技术体系详解:原理、架构与实践》

相关文章

  • 「大数据」04大数据框架:Lambda Architecture

    1.LA框架的提出 最早由Twitter工程师Nathan Marz提出来,它是一种大数据软件设计架构,其目的是指...

  • Lambda Architecture

    为什么要用Lambda Architecture 在大数据处理系统中,数据处理的可靠性和实时性是一对矛盾,往往不可...

  • lambda and kappa architecture

    参考 lambda: How to beat the CAPtheorem Lambda architecture...

  • 012 大数据架构 Lambda 架构

    012 Lambda Architecture – The New Big Data Architecture 1...

  • 数据分析概论

    数据分析框架 整个分析框架发为四大层次 数据规划 数据采集 数据分析 数据决策 在数据分析框架中,用户是数据的来源...

  • Druid架构分析

    lambda架构 druid采用lambda架构,将实时数据和批处理数据解耦。 实时数据处理面向写多读少的优化,批...

  • RxJava第一篇,RxJava入门

    RxJava: 是一个异步数据处理 扩展的观察者模式 轻量级框架 <1M jar 支持java 8 lambda ...

  • Lambda架构

    Lambda是实时处理框架Storm的作者Nathan Marz提出的用于同时处理离线和实时数据的架构理念。Lam...

  • GUI应用程序架构的十年变迁(四)

    Unidirectional User Interface Architecture:单向数据流 Unidirec...

  • Pinot架构介绍

    High Level Architecture 目的:对给定数据集提供分析服务2. 输入数据:Hadoop & K...

网友评论

      本文标题:「大数据」04大数据框架:Lambda Architecture

      本文链接:https://www.haomeiwen.com/subject/drvyfhtx.html