Skip to content

Commit cc4305c

Browse files
committed
feat: update mq-time-delay-and-expired-failure
RocketMQ 消息积压解决方案补充
1 parent 1df021f commit cc4305c

File tree

1 file changed

+48
-0
lines changed

1 file changed

+48
-0
lines changed

docs/high-concurrency/mq-time-delay-and-expired-failure.md

+48
Original file line numberDiff line numberDiff line change
@@ -37,3 +37,51 @@
3737
### mq 都快写满了
3838

3939
如果消息积压在 mq 里,你很长时间都没有处理掉,此时导致 mq 都快写满了,咋办?这个还有别的办法吗?没有,谁让你第一个方案执行的太慢了,你临时写程序,接入数据来消费,**消费一个丢弃一个,都不要了**,快速消费掉所有的消息。然后走第二个方案,到了晚上再补数据吧。
40+
41+
---
42+
43+
对于 RocketMQ,官方针对消息积压问题,提供了解决方案。
44+
45+
### 1. 提高消费并行度
46+
47+
绝大部分消息消费行为都属于 IO 密集型,即可能是操作数据库,或者调用 RPC,这类消费行为的消费速度在于后端数据库或者外系统的吞吐量,通过增加消费并行度,可以提高总的消费吞吐量,但是并行度增加到一定程度,反而会下降。所以,应用必须要设置合理的并行度。 如下有几种修改消费并行度的方法:
48+
49+
同一个 ConsumerGroup 下,通过增加 Consumer 实例数量来提高并行度(需要注意的是超过订阅队列数的 Consumer 实例无效)。可以通过加机器,或者在已有机器启动多个进程的方式。
50+
提高单个 Consumer 的消费并行线程,通过修改参数 consumeThreadMin、consumeThreadMax 实现。
51+
52+
### 2. 批量方式消费
53+
54+
某些业务流程如果支持批量方式消费,则可以很大程度上提高消费吞吐量,例如订单扣款类应用,一次处理一个订单耗时 1 s,一次处理 10 个订单可能也只耗时 2 s,这样即可大幅度提高消费的吞吐量,通过设置 consumer 的 consumeMessageBatchMaxSize 返个参数,默认是 1,即一次只消费一条消息,例如设置为 N,那么每次消费的消息数小于等于 N。
55+
56+
### 3. 跳过非重要消息
57+
58+
发生消息堆积时,如果消费速度一直追不上发送速度,如果业务对数据要求不高的话,可以选择丢弃不重要的消息。例如,当某个队列的消息数堆积到 100000 条以上,则尝试丢弃部分或全部消息,这样就可以快速追上发送消息的速度。示例代码如下:
59+
60+
```java
61+
public ConsumeConcurrentlyStatus consumeMessage(
62+
List<MessageExt> msgs,
63+
ConsumeConcurrentlyContext context) {
64+
long offset = msgs.get(0).getQueueOffset();
65+
String maxOffset =
66+
msgs.get(0).getProperty(Message.PROPERTY_MAX_OFFSET);
67+
long diff = Long.parseLong(maxOffset) - offset;
68+
if (diff > 100000) {
69+
// TODO 消息堆积情况的特殊处理
70+
return ConsumeConcurrentlyStatus.CONSUME_SUCCESS;
71+
}
72+
// TODO 正常消费过程
73+
return ConsumeConcurrentlyStatus.CONSUME_SUCCESS;
74+
}
75+
```
76+
77+
### 4. 优化每条消息消费过程
78+
79+
举例如下,某条消息的消费过程如下:
80+
81+
- 根据消息从 DB 查询【数据 1】
82+
- 根据消息从 DB 查询【数据 2】
83+
- 复杂的业务计算
84+
- 向 DB 插入【数据 3】
85+
- 向 DB 插入【数据 4】
86+
87+
这条消息的消费过程中有 4 次与 DB 的 交互,如果按照每次 5ms 计算,那么总共耗时 20ms,假设业务计算耗时 5ms,那么总过耗时 25ms,所以如果能把 4 次 DB 交互优化为 2 次,那么总耗时就可以优化到 15ms,即总体性能提高了 40%。所以应用如果对时延敏感的话,可以把 DB 部署在 SSD 硬盘,相比于 SCSI 磁盘,前者的 RT 会小很多。

0 commit comments

Comments
 (0)