常用消息队列框架与技术选型 (常用消息队列对比)
简介
消息队列是分布式系统中至关重要的组件,它们负责解决应用解耦、异步消息处理、流量削峰等关键问题,为系统提供高性能、高可用、可伸缩和最终一致性的架构基础。消息队列的作用
降低系统耦合性
在分布式系统中,服务间可能存在复杂的依赖关系。若直接进行服务调用,会增加服务间的耦合度,降低系统的灵活性。消息队列可将服务间的通信转换为消息的发送和接收,减少服务间的直接依赖。流量削峰
高并发场景下,瞬间的请求量可能超出系统的处理能力。消息队列可实现流量削峰,将请求放入队列中,由消费者服务异步处理,有效降低瞬间请求量,保障系统稳定性。异步处理
分布式系统中,不同服务间的调用可能会受网络延迟或服务负载影响,导致调用时间较长。消息队列可实现异步处理,将请求放入队列中,由消费者服务异步消费,提高系统的并发性和吞吐量。主流消息队列框架
市面上主流的消息队列框架包括: Kafka ActiveMQ RabbitMQ RocketMQ 其中,RocketMQ和Kafka作为高吞吐量、高可用的分布式消息队列系统,在双11等高并发场景中尤为突出。RocketMQ 与 Kafka 对比
| 特性 | RocketMQ | Kafka | | -------------------- | --------------------------------------------------- | -------------------------------------------- | | 数据可靠性 | 强一致性保证,确保消息必定到达目的地 | 默认情况下采用副本保证消息不丢失,但可能存在重复 | | 单机支持的队列数 | 每台 Broker 支持数千个队列 | 每台 Broker 支持数百万个分区 | | 消息投递的实时性 | 发送到本地 Broker 后即可反馈成功,实时性好 | 可能需等待副本同步完成后才会反馈成功,实时性较低 | | 消费失败重试 | 内置重试机制,可自动重试失败的消息 | 无内置重试机制,需要应用层自行实现重试 | | 消息有序性 | 支持同 Topic 消息按顺序消费 | 默认情况下不支持消息顺序消费 | | 定时消息 | 支持定时消息功能 | 无内置定时消息功能 | | 分布式事务消息 | 支持二阶段提交,保证事务性消息的可靠交付 | 无内置分布式事务消息功能 | | 消息查询 | 支持对存储的消息进行查询 | 无内置消息查询功能 | | 消息回溯 | 支持消息回溯 | 无内置消息回溯功能 | | 消息并行度 | 消费者以线程池的形式消费消息,支持高并行度消费 | 消费者以进程的形式消费消息,并行度受限于进程数 |消息队列选型
选择消息队列时,应考虑以下因素: 消息可靠性要求 吞吐量和延迟要求 分布式事务特性 消息查询和回溯需求 并行消费能力常见问题
如何避免重复消费?
生产端:采用序列号或去重机制,确保同一条消息只发送一次。 消费端:使用幂等性处理逻辑,保证即使重复消费,也不会影响业务逻辑。如何保证幂等性?
幂等函数:对同一个输入值,无论执行多少次,其结果都相同。 事务机制:保证操作的原子性和一致性,防止重复执行。 记录执行结果:记录已执行操作的结果,防止重复执行。如何解决消息丢失?
生产端:启用消息持久化,确保消息及时写入磁盘。 MQ 服务:配置消息冗余和故障恢复机制,避免消息因服务故障而丢失。 消费端:关闭自动确认,仅在消息处理成功后手动发送确认。如何保證消息有序性?
生产端:按顺序发送消息,并记录上一条消息 ID。 消费端:按记录的 ID 顺序消费消息。如何解决消息积压问题?
扩容消息队列:增加队列容量,提高消息处理能力。 优化消息处理逻辑:减少消息处理时间,提高消费效率。 优先处理重要消息:对于重要消息,优先分配资源进行处理。什么叫“技术选型”
技术选型指的是根据实际业务管理的需要,对硬件、软件及所要用到的技术进行规格选择。
规格型号是反映商品性质、性能、品质等一系列的指标,一般由一组字母和数字以一定的规律编号组成。如品牌、等级、成分、含量、纯度、大小(尺寸、重量)等。商品名称和规格型号要规范准确详尽,这样才能够保证归类准确、统计清晰。
简单的说,规格是指该设备能干什么,型号是指此类设备的出厂身份。通常是:产品具有相同的名称(包括商品名)和相同的使用目的,但在不同的使用场合,如使用对象或使用条件等发生变化时,需要根据使用场合和条件的不同,依据产品的特定技术指标进行选择性使用。
扩展资料
以产品的一种或几种具有代表性的特性为主,对产品作出的代号性的表示,不同型号产品的功用可以是相同的也可以是不同的,相同功用的产品对于不同的生产厂商而言也可以使用不同的型号,即使技术参数完全相同,但不同厂家的型号可以不同。
对于同一生产商,功用相同而型号不同的系列产品,通常其型号的使用必须遵守事先制订好的技术文件中约定的准则,这种情况下,每一型号产品的基本功用(或声明用途)必须是相同的,但可以基于配置和附件等诸方面的不同,在产品的附加和扩展功能上可以存在区别。
大数据Kafka中常用Message Queue有哪些区别呢?
常用Message Queue对比3.1 RabbitMQRabbitMQ是使用Erlang编写的一个开源的消息队列,本身支持很多的协议:AMQP,XMPP, SMTP, STOMP,也正因如此,它非常重量级,更适合于企业级的开发。 同时实现了Broker构架,这意味着消息在发送给客户端时先在中心队列排队。 对路由,负载均衡或者数据持久化都有很好的支持。 3.2 RedisRedis是一个基于Key-Value对的NoSQL数据库,开发维护很活跃。 虽然它是一个Key-Value数据库存储系统,但它本身支持MQ功能,所以完全可以当做一个轻量级的队列服务来使用。 对于RabbitMQ和Redis的入队和出队操作,各执行100万次,每10万次记录一次执行时间。 测试数据分为128Bytes、512Bytes、1K和10K四个不同大小的数据。 实验表明:入队时,当数据比较小时Redis的性能要高于RabbitMQ,而如果数据大小超过了10K,Redis则慢的无法忍受;出队时,无论数据大小,Redis都表现出非常好的性能,而RabbitMQ的出队性能则远低于Redis。 3.3 ZeroMQZeroMQ号称最快的消息队列系统,尤其针对大吞吐量的需求场景。 ZeroMQ能够实现RabbitMQ不擅长的高级/复杂的队列,但是开发人员需要自己组合多种技术框架,技术上的复杂度是对这MQ能够应用成功的挑战。 ZeroMQ具有一个独特的非中间件的模式,你不需要安装和运行一个消息服务器或中间件,因为你的应用程序将扮演这个服务器角色。 你只需要简单的引用ZeroMQ程序库,可以使用NuGet安装,然后你就可以愉快的在应用程序之间发送消息了。 但是ZeroMQ仅提供非持久性的队列,也就是说如果宕机,数据将会丢失。 其中,Twitter的Storm 0.9.0以前的版本中默认使用ZeroMQ作为数据流的传输(Storm从0.9版本开始同时支持ZeroMQ和Netty作为传输模块)。 3.4 ActiveMQActiveMQ是Apache下的一个子项目。 类似于ZeroMQ,它能够以代理人和点对点的技术实现队列。 同时类似于RabbitMQ,它少量代码就可以高效地实现高级应用场景。 3.5 Kafka/JafkaKafka是Apache下的一个子项目,是一个高性能跨语言分布式发布/订阅消息队列系统,而Jafka是在Kafka之上孵化而来的,即Kafka的一个升级版。 具有以下特性:快速持久化,可以在O(1)的系统开销下进行消息持久化;高吞吐,在一台普通的服务器上既可以达到10W/s的吞吐速率;完全的分布式系统,Broker、Producer、Consumer都原生自动支持分布式,自动实现负载均衡;支持Hadoop数据并行加载,对于像Hadoop的一样的日志数据和离线分析系统,但又要求实时处理的限制,这是一个可行的解决方案。 Kafka通过Hadoop的并行加载机制统一了在线和离线的消息处理。 Apache Kafka相对于ActiveMQ是一个非常轻量级的消息系统,除了性能非常好之外,还是一个工作良好的分布式系统。 上图中一个topic配置了3个partition。 Partition1有两个offset:0和1。 Partition2有4个offset。 Partition3有1个offset。 副本的id和副本所在的机器的id恰好相同。 如果一个topic的副本数为3,那么Kafka将在集群中为每个partition创建3个相同的副本。 集群中的每个broker存储一个或多个partition。 多个producer和consumer可同时生产和消费数据。
免责声明:本文转载或采集自网络,版权归原作者所有。本网站刊发此文旨在传递更多信息,并不代表本网赞同其观点和对其真实性负责。如涉及版权、内容等问题,请联系本网,我们将在第一时间删除。同时,本网站不对所刊发内容的准确性、真实性、完整性、及时性、原创性等进行保证,请读者仅作参考,并请自行核实相关内容。对于因使用或依赖本文内容所产生的任何直接或间接损失,本网站不承担任何责任。