kafka核心消费逻辑源码分析

其他教程   发布日期:2025年02月04日   浏览次数:195

本篇内容主要讲解“kafka核心消费逻辑源码分析”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“kafka核心消费逻辑源码分析”吧!

消费逻辑

框架搭建好之后着手开发下kafka的核心消费逻辑,流式图表的核心消费逻辑就是实现一个消费链接池维护消费者客户端链接,将kafka client封装成Runable任务提交到线程池里做一个常驻线程,实时消费数据,消费到数据后存到redis中,并通过websocket推送到浏览器,浏览器刷新图表实现流式图表功能。

代码设计

按照之前的代码划分,核心逻辑写在matrix-core子模块中,整体结构用maven的父子模块依赖继承的特性管理依赖。

maxtrix-core模块只做kafka client的管理和消费逻辑,尽量轻一点,只需要引入redis和kafka依赖即可。

  1. <dependency>
  2. <groupId>org.apache.kafka</groupId>
  3. <artifactId>kafka-clients</artifactId>
  4. </dependency>
  5. <dependency>
  6. <groupId>org.springframework.boot</groupId>
  7. <artifactId>spring-boot-starter-data-redis</artifactId>
  8. </dependency>
  9. <dependency>
  10. <groupId>com.uptown</groupId>
  11. <artifactId>matrix-common</artifactId>
  12. <version>1.0-SNAPSHOT</version>
  13. </dependency>

反序列化工具、线程池工具、lombok都放到matrix-common中,具体用google的包,这样其他内部模块直接引用common模块即可使用。

  1. <dependency>
  2. <groupId>com.google.code.gson</groupId>
  3. <artifactId>gson</artifactId>
  4. </dependency>

消费池

首先要创建出一个线程池出来,由于我们的业务要实时监听数据,所以线程池提交的线程必须是个常驻线程。所以需要重写线程池的任务失败策略和异常处理器。

  1. // 自定义异常处理器,捕获错误日志
  2. @Slf4j
  3. public class ConsumerExceptionHandler implements Thread.UncaughtExceptionHandler {
  4. @Override
  5. public void uncaughtException(Thread t, Throwable e) {
  6. log.error(e.getMessage(), e);
  7. }
  8. }
  1. // 任务失败策略
  2. @Slf4j
  3. class ConsumerThreadPoolExecutor extends ThreadPoolExecutor {
  4. ConsumerThreadPoolExecutor(int corePoolSize,
  5. int maximumPoolSize,
  6. long keepAliveTime,
  7. TimeUnit unit,
  8. BlockingQueue<Runnable> workQueue,
  9. ThreadFactory threadFactory,
  10. RejectedExecutionHandler rejectedExecutionHandler) {
  11. super(corePoolSize, maximumPoolSize, keepAliveTime, unit, workQueue, threadFactory, rejectedExecutionHandler);
  12. }
  13. @Override
  14. protected void afterExecute(Runnable r, Throwable t) {
  15. super.afterExecute(r, t);
  16. //若线程执行某任务失败了,重新提交该任务
  17. if (t != null) {
  18. log.error("restart kafka consumer task for {}", (Object) t.getStackTrace());
  19. }
  20. execute(r);
  21. }
  22. }

剩下的创建出线程池即可,消费逻辑中只需要注入到具体类中即可。

  1. @Data
  2. @Component
  3. @Slf4j
  4. public class KafkaConsumerConfig {
  5. // 线程池维护线程的最少数量
  6. @Value(value = "${kafka.core-pool-size:20}")
  7. private int corePoolSize;
  8. // 线程池维护线程的最大数量
  9. @Value(value = "${kafka.max-pool-size:20}")
  10. private int maxPoolSize;
  11. // 线程池维护线程所允许的空闲时间
  12. @Value(value = "${kafka.keep-alive-time:0}")
  13. private int keepAliveTime;
  14. // 线程池所使用的缓冲队列大小
  15. @Value(value = "${kafka.work-queue-size:0}")
  16. private int workQueueSize;
  17. // 统一存放kafka客户端的map
  18. @Bean
  19. public Map<String, KafkaConsumerRunnable> globalKafkaConsumerThreadMap() {
  20. return Maps.newConcurrentMap();
  21. }
  22. /**
  23. * kafka监听任务 线程池
  24. */
  25. @Bean(name = "defaultThreadPool")
  26. public ThreadPoolExecutor defaultThreadPool() {
  27. // 使用google线程工厂 线程挂掉重启策略
  28. ConsumerExceptionHandler exceptionHandler = new ConsumerExceptionHandler();
  29. ThreadFactory threadFactory = new ThreadFactoryBuilder().setNameFormat("kafka-consumer-%d")
  30. .setUncaughtExceptionHandler(exceptionHandler).build();
  31. return new ConsumerThreadPoolExecutor(
  32. corePoolSize,
  33. maxPoolSize,
  34. keepAliveTime,
  35. TimeUnit.SECONDS,
  36. new LinkedBlockingDeque<>(maxPoolSize),
  37. threadFactory,
  38. new ThreadPoolExecutor.CallerRunsPolicy()
  39. );
  40. }
  41. }

这么搞的主要原因是防止消费线程中出现消费异常,比如反序列化异常、客户端监听网络异常等,为啥不在任务中try catch住异常是因为这样做更优雅点,让kafka client和线程的生命绑定一块,比较好管理。

以上就是kafka核心消费逻辑源码分析的详细内容,更多关于kafka核心消费逻辑源码分析的资料请关注九品源码其它相关文章!