kafka

作者: 云烟1f3bca320ba6 | 来源:发表于2017-03-08 23:00 被阅读0次

Kafka详细的设计和生态系统
kafka全面认知
Kafka & NSQ
kafka学习系列
Kafka Producer源码
Kafka 详解一简介
kafka详解
kafka配置KAFKA_LISTENERS和KAFKA_ADV
Kafka 基本原理
Spark Streaming实时流处理-3.分布式消息队列Ka

Kafka

介绍

kafka是一个分布式的流消息处理平台，由LinkedIn开发。

使用场景

系统之间解耦
流式数据处理
消息堆积

总体架构

kafka.png

Broker Kafka集群包含一个或多个服务器，这种服务器被称为broker
Topic 每条发布到Kafka集群的消息都有一个类别，这个类别被称为Topic。（物理上不同Topic的消息分开存储，逻辑上一个Topic的消息虽然保存于一个或多个broker上但用户只需指定消息的Topic即可生产或消费数据而不必关心数据存于何处）
Partition Parition是物理上的概念，每个Topic包含一个或多个Partition.
Producer 负责发布消息到Kafka broker
Consumer 消息消费者，向Kafka broker读取消息的客户端。
Consumer Group 每个Consumer属于一个特定的Consumer Group（可为每个Consumer指定group name，若不指定group name则属于默认的group）。

Kafka基线数据

生产者数据

producerlinear.png

消费者数据

consumer_throughput.png

kafka原理

kafka写入数据

log_anatomy.png

kafka文件结构

kafka-fs-segment-file-list-small.png

kafka-fs-index-correspond-data.png

kafka中zookeeper结构

20140923175837147.png

kafka-partition

consumer-groups.png

kafka-replication

0416000.png

0416003.png

常用命令

启动kafka bin/zookeeper-server-start.sh config/zookeeper.properties
创建topic bin/kafka-topics.sh --create --zookeeper localhost:2181 --replication-factor 1 --partitions 1 --topic test
查看topic bin/kafka-topics.sh --list --zookeeper localhost:2181
发送消息  bin/kafka-console-producer.sh --broker-list localhost:9092 --topic test
消费消息  bin/kafka-console-consumer.sh --bootstrap-server localhost:9092 --topic test --from-beginning

java代码

生产者和消费者

<dependency>
  <groupId>org.apache.kafka</groupId>
  <artifactId>kafka-clients</artifactId>
  <version>0.10.2.0</version>
</dependency>

//生产者
Properties props = new Properties();
props.put("bootstrap.servers", "localhost:9092");
props.put("acks", "all");
props.put("retries", 0);
props.put("batch.size", 16384);
props.put("linger.ms", 1);
props.put("buffer.memory", 33554432);
props.put("key.serializer", "org.apache.kafka.common.serialization.StringSerializer");
props.put("value.serializer", "org.apache.kafka.common.serialization.StringSerializer");

Producer<String, String> producer = new KafkaProducer<>(props);
for(int i = 0; i < 100; i++)
    producer.send(new ProducerRecord<String, String>("my-topic", Integer.toString(i), Integer.toString(i)));

producer.close();


//消费者
Properties props = new Properties();
props.put("bootstrap.servers", "localhost:9092");
props.put("group.id", "test");
props.put("enable.auto.commit", "true");
props.put("auto.commit.interval.ms", "1000");
props.put("key.deserializer", "org.apache.kafka.common.serialization.StringDeserializer");
props.put("value.deserializer", "org.apache.kafka.common.serialization.StringDeserializer");
KafkaConsumer<String, String> consumer = new KafkaConsumer<>(props);
consumer.subscribe(Arrays.asList("foo", "bar"));
while (true) {
  ConsumerRecords<String, String> records = consumer.poll(100);
  for (ConsumerRecord<String, String> record : records)
      System.out.printf("offset = %d, key = %s, value = %s%n", record.offset(), record.key(), record.value());
}

流式数据

<dependency>
  <groupId>org.apache.kafka</groupId>
  <artifactId>kafka-streams</artifactId>
  <version>0.10.2.0</version>
</dependency>

Map<String, Object> props = new HashMap<>();
props.put(StreamsConfig.APPLICATION_ID_CONFIG, "my-stream-processing-application");
props.put(StreamsConfig.BOOTSTRAP_SERVERS_CONFIG, "localhost:9092");
props.put(StreamsConfig.KEY_SERDE_CLASS_CONFIG, Serdes.String().getClass());
props.put(StreamsConfig.VALUE_SERDE_CLASS_CONFIG, Serdes.String().getClass());
StreamsConfig config = new StreamsConfig(props);

KStreamBuilder builder = new KStreamBuilder();
builder.stream("my-input-topic").mapValues(value -> value.length().toString()).to("my-output-topic");

KafkaStreams streams = new KafkaStreams(builder, config);
streams.start();

网友评论

本文标题：kafka

本文链接：https://www.haomeiwen.com/subject/udvigttx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

kafka

Kafka

介绍

使用场景

总体架构

Kafka基线数据

生产者数据

消费者数据

kafka原理

kafka写入数据

kafka文件结构

kafka中zookeeper结构

kafka-partition

kafka-replication

常用命令

java代码

相关文章

Kafka详细的设计和生态系统

kafka全面认知

Kafka & NSQ

kafka学习系列

Kafka Producer源码

Kafka 详解一简介

kafka详解

kafka配置KAFKA_LISTENERS和KAFKA_ADV

Kafka 基本原理

Spark Streaming实时流处理-3.分布式消息队列Ka

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读