Kafka Producers & Consumers
Producer API
Key Responsibilities
Java Example
Python Example (kafka-python)
Consumer API
Consumer Groups & Rebalancing
Java Example
Delivery Semantics
Important Configurations
Producer Configs
Consumer Configs
Best Practices
Exactly-Once Semantics (EOS)
Idempotent Producer
Transactional Producer
Transactional Consumer
Consumer Group Rebalancing Deep Dive
What Triggers Rebalancing?
Rebalancing Strategies
Configuring Cooperative Rebalancing
Preventing Unnecessary Rebalances
Producer Partitioning Strategies
Default Partitioner
Custom Partitioner
Offset Management
Manual vs Auto Commit
Best Practice: Commit After Processing
Seek to Specific Offset
Interview Questions & Answers
Common Pitfalls

Kafka Producers & Consumers

Learn to build robust applications that publish and subscribe to Kafka topics.

Producer API

Producers publish data to the topics of their choice.

Key Responsibilities

Partitioning: Deciding which partition to send the message to.
Serialization: Converting key/value objects to bytes.
Compression: Reducing network bandwidth (Snappy, Gzip, LZ4, Zstd).
Batching: Grouping messages for efficiency.

Java Example

import org.apache.kafka.clients.producer.*;
import java.util.Properties;

public class SimpleProducer {
    public static void main(String[] args) {
        Properties props = new Properties();
        props.put("bootstrap.servers", "localhost:9092");
        props.put("key.serializer", "org.apache.kafka.common.serialization.StringSerializer");
        props.put("value.serializer", "org.apache.kafka.common.serialization.StringSerializer");
        
        // Reliability Configs
        props.put("acks", "all"); // Wait for all replicas
        props.put("retries", 3);  // Retry on failure
        props.put("linger.ms", 1); // Wait 1ms to batch messages

        Producer<String, String> producer = new KafkaProducer<>(props);

        for (int i = 0; i < 100; i++) {
            producer.send(new ProducerRecord<>("my-topic", Integer.toString(i), "Message " + i),
                (metadata, exception) -> {
                    if (exception == null) {
                        System.out.printf("Sent to partition %d @ offset %d%n", 
                            metadata.partition(), metadata.offset());
                    } else {
                        exception.printStackTrace();
                    }
                });
        }
        producer.close();
    }
}

Python Example (kafka-python)

from kafka import KafkaProducer
import json

producer = KafkaProducer(
    bootstrap_servers=['localhost:9092'],
    value_serializer=lambda x: json.dumps(x).encode('utf-8')
)

# Asynchronous send
future = producer.send('my-topic', value={'key': 'value'})
result = future.get(timeout=60)

Consumer API

Consumers read data from topics. They subscribe to one or more topics and pull data.

Consumer Groups & Rebalancing

Consumer Group: A pool of consumers that share the work.
Rebalancing: When a consumer joins/leaves, partitions are reassigned.

Java Example

import org.apache.kafka.clients.consumer.*;
import java.time.Duration;
import java.util.Arrays;
import java.util.Properties;

public class SimpleConsumer {
    public static void main(String[] args) {
        Properties props = new Properties();
        props.put("bootstrap.servers", "localhost:9092");
        props.put("group.id", "my-group");
        props.put("enable.auto.commit", "false"); // Manual commit for safety
        props.put("key.deserializer", "org.apache.kafka.common.serialization.StringDeserializer");
        props.put("value.deserializer", "org.apache.kafka.common.serialization.StringDeserializer");

        KafkaConsumer<String, String> consumer = new KafkaConsumer<>(props);
        consumer.subscribe(Arrays.asList("my-topic"));

        while (true) {
            ConsumerRecords<String, String> records = consumer.poll(Duration.ofMillis(100));
            for (ConsumerRecord<String, String> record : records) {
                System.out.printf("offset = %d, key = %s, value = %s%n", 
                    record.offset(), record.key(), record.value());
                
                // Process record...
            }
            consumer.commitSync(); // Commit offsets after processing
        }
    }
}

Delivery Semantics

At Most Once

Messages may be lost, but never duplicated. Commit offset before processing.

At Least Once

Messages are never lost, but may be duplicated. Commit offset after processing. (Default/Preferred)

Exactly Once

Each message is delivered exactly once. Requires Transactional API.

Important Configurations

Producer Configs

Config	Description	Recommended
`acks`	How many replicas must acknowledge	`all` (for durability)
`retries`	Retry count on transient errors	`Integer.MAX_VALUE`
`enable.idempotence`	Prevent duplicates	`true`
`compression.type`	Compression algorithm	`snappy` or `lz4`

Consumer Configs

Config	Description	Recommended
`group.id`	Unique ID for the consumer group	Required
`auto.offset.reset`	What to do if no offset exists	`earliest` (start from beginning)
`enable.auto.commit`	Auto-commit offsets	`false` (manual control)
`max.poll.records`	Max records per poll	Tuned to processing speed

Best Practices

Handle Rebalancing

Handle WakeupException and close consumers gracefully to trigger a rebalance immediately rather than waiting for a timeout.

Idempotent Processing

Since “At Least Once” is common, ensure your processing logic handles duplicates (e.g., using a database unique constraint).

Monitor Lag

Consumer Lag is the difference between the latest offset in the partition and the consumer’s current offset. High lag means consumers are too slow.

Exactly-Once Semantics (EOS)

Exactly-once is the holy grail of message delivery. Kafka supports it through Idempotent Producers and Transactions.

Idempotent Producer

Prevents duplicates caused by producer retries.

props.put("enable.idempotence", "true");  // Enables idempotent producer
// Automatically sets:
// acks = all
// retries = Integer.MAX_VALUE
// max.in.flight.requests.per.connection = 5

How it works:

Producer assigns a Producer ID (PID) and sequence number to each message
Broker deduplicates based on PID + sequence number
If retry sends duplicate, broker recognizes and discards it

Transactional Producer

For atomic writes across multiple partitions/topics.

props.put("transactional.id", "my-transactional-producer");

producer.initTransactions();

try {
    producer.beginTransaction();
    
    producer.send(new ProducerRecord<>("topic1", "key", "value1"));
    producer.send(new ProducerRecord<>("topic2", "key", "value2"));
    
    // Commit offsets as part of transaction (consume-transform-produce pattern)
    producer.sendOffsetsToTransaction(offsets, consumerGroupId);
    
    producer.commitTransaction();
} catch (Exception e) {
    producer.abortTransaction();
}

Transactional Consumer

Read only committed messages:

props.put("isolation.level", "read_committed");

Isolation Level	Behavior
`read_uncommitted`	See all messages (including aborted)
`read_committed`	Only see committed transactions

Consumer Group Rebalancing Deep Dive

Rebalancing is one of the most misunderstood Kafka concepts.

What Triggers Rebalancing?

Consumer joins the group
Consumer leaves the group (graceful or crash)
Consumer fails to send heartbeat within session.timeout.ms
Topic partition count changes
Consumer subscription changes

Rebalancing Strategies

Strategy	Behavior	Use Case
Range	Consecutive partitions to each consumer	Co-partitioned topics
RoundRobin	Evenly distributed	General purpose
Sticky	Minimizes partition movement	Reduce reprocessing
Cooperative Sticky	Incremental rebalance (no stop-the-world)	Production recommended

Configuring Cooperative Rebalancing

props.put("partition.assignment.strategy", 
    "org.apache.kafka.clients.consumer.CooperativeStickyAssignor");

Preventing Unnecessary Rebalances

// Increase timeouts to avoid false positives
props.put("session.timeout.ms", "45000");     // Default: 10000
props.put("heartbeat.interval.ms", "15000");  // Default: 3000
props.put("max.poll.interval.ms", "300000");  // Default: 300000

Interview Tip: Know the difference between session.timeout.ms and max.poll.interval.ms:

session.timeout.ms: Time without heartbeats before consumer is considered dead
max.poll.interval.ms: Time between poll() calls before consumer is kicked out

Producer Partitioning Strategies

Default Partitioner

// With key: hash(key) % numPartitions
// Without key: Round-robin (with sticky optimization)
producer.send(new ProducerRecord<>("topic", "user123", "data"));

Custom Partitioner

public class GeoPartitioner implements Partitioner {
    @Override
    public int partition(String topic, Object key, byte[] keyBytes,
                         Object value, byte[] valueBytes, Cluster cluster) {
        String region = extractRegion(key);
        if ("us".equals(region)) return 0;
        if ("eu".equals(region)) return 1;
        return 2;
    }
}

props.put("partitioner.class", "com.example.GeoPartitioner");

Offset Management

Manual vs Auto Commit

Mode	Config	Behavior	Risk
Auto	`enable.auto.commit=true`	Commits every 5s	Data loss on crash
Manual Sync	`consumer.commitSync()`	Blocks until committed	Slower
Manual Async	`consumer.commitAsync()`	Non-blocking	May fail silently

Best Practice: Commit After Processing

while (true) {
    ConsumerRecords<String, String> records = consumer.poll(Duration.ofMillis(100));
    
    for (ConsumerRecord<String, String> record : records) {
        processRecord(record);  // Process first
    }
    
    consumer.commitSync();  // Then commit
}

Seek to Specific Offset

// Seek to beginning
consumer.seekToBeginning(consumer.assignment());

// Seek to end
consumer.seekToEnd(consumer.assignment());

// Seek to specific offset
consumer.seek(new TopicPartition("topic", 0), 100L);

// Seek to timestamp
Map<TopicPartition, Long> timestamps = new HashMap<>();
timestamps.put(partition, yesterdayTimestamp);
Map<TopicPartition, OffsetAndTimestamp> offsets = consumer.offsetsForTimes(timestamps);
consumer.seek(partition, offsets.get(partition).offset());

Interview Questions & Answers

What is the difference between At-Least-Once and Exactly-Once?

Delivery	Description	How to Achieve
At-Most-Once	May lose messages	Commit before processing
At-Least-Once	May have duplicates	Commit after processing
Exactly-Once	No loss, no duplicates	Idempotent + Transactions

Exactly-once requires:

enable.idempotence=true
Transactional producer
isolation.level=read_committed for consumers

How do you handle consumer lag?

Diagnosis:

kafka-consumer-groups.sh --describe --group my-group

Solutions:

Add consumers: More consumers = more parallelism (up to partition count)
Increase partitions: Allows more consumers
Optimize processing: Batch database writes, use async I/O
Increase batch size: max.poll.records
Skip old data: Reset offset to latest

What happens if a consumer takes too long to process?

If time between poll() calls exceeds max.poll.interval.ms:

Consumer is considered dead
Rebalance is triggered
Partitions are reassigned
Consumer may process same messages again (duplicates)

Fix: Increase max.poll.interval.ms or reduce max.poll.records

How do you ensure message ordering?

Within a partition: Guaranteed by KafkaFor a specific key: Use a key when producing

// All orders for user123 go to same partition → ordered
producer.send(new ProducerRecord<>("orders", "user123", orderJson));

Gotcha with retries: Set max.in.flight.requests.per.connection=1 or use idempotent producer to prevent reordering on retry.

What is the difference between commitSync and commitAsync?

Method	Behavior	Use Case
`commitSync()`	Blocks until committed	Safety critical
`commitAsync()`	Non-blocking, callback	High throughput

Best practice: Use commitAsync() in loop, commitSync() on shutdown:

try {
    while (running) {
        poll and process...
        consumer.commitAsync();
    }
} finally {
    consumer.commitSync();  // Final sync commit
    consumer.close();
}

Common Pitfalls

1. Auto-Commit with Slow Processing: If processing takes > 5s, offsets are committed before processing completes → data loss on crash.2. Not Handling Rebalancing: During rebalance, partitions are revoked. Commit offsets before they’re revoked or you’ll reprocess.3. Single-Threaded Processing: If one message is slow, all processing blocks. Consider async processing.4. max.poll.records Too High: Fetching 10,000 records but processing is slow → rebalance kicks you out.5. Not Monitoring Consumer Lag: Lag indicates consumers can’t keep up. Set up alerts!

Next: Kafka Streams →

Fundamentals Streams

Overview

Testing & Code Quality

Crash Courses

AI Engineering

Math for ML - Understanding Linear Algebra

Probability & Statistics for ML

Math for ML - Understanding Calculus

ML Mastery

Deep Learning Mastery

NestJS Mastery

Microservices Mastery

Low Level Design

OOP Concepts

SOLID Principles

Design Patterns

LLD Case Studies

System Design (HLD)

Senior Level (L5+/Staff)

HLD Case Studies

Engineering Fundamentals

DevOps & Operations

Azure Cloud Engineering

AWS Cloud

AWS Monitoring & Observability

AWS Security Services

AWS Serverless

AWS Operations

AWS Advanced

AWS Case Studies

GCP Cloud Engineering

DevOps Tools

Database Engineering

HIPAA Compliance Mastery

Operating Systems

Linux Internals

Distributed Systems

Networking Mastery

Build Your Own X

Go Lang Mastery

C Programming

Classic Research Papers

Distributed System Tools

​Kafka Producers & Consumers

​Producer API

​Key Responsibilities

​Java Example

​Python Example (kafka-python)

​Consumer API

​Consumer Groups & Rebalancing

​Java Example

​Delivery Semantics

At Most Once

At Least Once

Exactly Once

​Important Configurations

​Producer Configs

​Consumer Configs

​Best Practices

​Exactly-Once Semantics (EOS)

​Idempotent Producer

​Transactional Producer

​Transactional Consumer

​Consumer Group Rebalancing Deep Dive

​What Triggers Rebalancing?

​Rebalancing Strategies

​Configuring Cooperative Rebalancing

​Preventing Unnecessary Rebalances

​Producer Partitioning Strategies

​Default Partitioner

​Custom Partitioner

​Offset Management

​Manual vs Auto Commit

​Best Practice: Commit After Processing

​Seek to Specific Offset

​Interview Questions & Answers

​Common Pitfalls

Kafka Producers & Consumers

Producer API

Key Responsibilities

Java Example

Python Example (kafka-python)

Consumer API

Consumer Groups & Rebalancing

Java Example

Delivery Semantics

Important Configurations

Producer Configs

Consumer Configs

Best Practices

Exactly-Once Semantics (EOS)

Idempotent Producer

Transactional Producer

Transactional Consumer

Consumer Group Rebalancing Deep Dive

What Triggers Rebalancing?

Rebalancing Strategies

Configuring Cooperative Rebalancing

Preventing Unnecessary Rebalances

Producer Partitioning Strategies

Default Partitioner

Custom Partitioner

Offset Management

Manual vs Auto Commit

Best Practice: Commit After Processing

Seek to Specific Offset

Interview Questions & Answers

Common Pitfalls