Least Activity LoadBalance配置 -

frankfan915

浏览: 350125 次
性别:
来自: 杭州

最近访客更多访客>>

gaojingsong

javacoo

449582981

nick_jian

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

Least Activity LoadBalance配置

博客分类：

Dubbo

背景：

前段时间，发生了某个服务节点发生问题，被阻塞时，影响了整套系统的运行。期望在运行的时候，当某个节点发生问题的时候，上级服务可以调用另一个可以节点，不会影响整套系统。

分析：

主要是不可用节点阻塞达30秒以上，我们使用的是random loadbalance的负载均衡策略。上级应用不断的调用不可用节点，导致被阻塞的调用越来越多，一直到报线程用完错误。

猜想可解决的方案：

1. 对于一些耗时少的服务，上级应用应该设置比较短的timeout时间，然后设置retry为下级节点数，这样就可以无失败次数

2.对于耗时长的服务，上级应用需要设置长的timeout时间，这时可以设置loadbalance为leastactivity

配置示例：

<dubbo:reference id="helloWorldService" interface="IHelloWorldService" group="test" timeout="5000" loadbalance="leastactive" actives="200"/>

在Consumer上需要添加loadbalance和actives, actives表示Activity最大的并发数，如果超过这个并发数，在invoke时将会等待。Activity的代码如下所示：

   int max = invoker.getUrl().getMethodParameter(methodName, Constants.ACTIVES_KEY, 0);
        RpcStatus count = RpcStatus.getStatus(invoker.getUrl(), invocation.getMethodName());
        if (max > 0) {
            long timeout = invoker.getUrl().getMethodParameter(invocation.getMethodName(), Constants.TIMEOUT_KEY, 0);
            long start = System.currentTimeMillis();
            long remain = timeout;
            int active = count.getActive();
            if (active >= max) {
                synchronized (count) {
                    while ((active = count.getActive()) >= max) {
                        try {
                            count.wait(remain);
                        } catch (InterruptedException e) {
                        }
                        long elapsed = System.currentTimeMillis() - start;
                        remain = timeout - elapsed;
                        if (remain <= 0) {
                            throw new RpcException("Waiting concurrent invoke timeout in client-side for service:  "
                                                   + invoker.getInterface().getName() + ", method: "
                                                   + invocation.getMethodName() + ", elapsed: " + elapsed
                                                   + ", timeout: " + timeout + ". concurrent invokes: " + active
                                                   + ". max concurrent invoke limit: " + max);
                        }
                    }
                }
            }
        }

测试：

案例1： Consumer 设置为5秒超时，每100毫秒，并发发送100个请求，总共执行150次，预计15秒测试完成。loadbalance策略为Random. Retry次数为0.

Provider 1：每个请求sleep 10毫秒

Provider 2：每个请求sleep 10秒

结果：

Consumer: 总调用次数:15000,成功次数:7460,错误次数:7540,耗时:131227毫秒

Provider1: 执行总数为7460

Provider2: 执行总数为2590，其他请求都报“Thread pool is EXHAUSTED”异常

案例2： Consumer 设置为5秒超时，每100毫秒，并发发送100个请求，总共执行150次，loadbalance策略为Random. Retry次数为1.

Provider 1：每个请求sleep 10毫秒

Provider 2：每个请求sleep 10秒

结果：

Consumer: 总调用次数:15000,成功次数:15000,错误次数:0,耗时:129134毫秒

Provider1: 执行总数为15000

Provider2: 执行总数为2600

案例3： Consumer 设置为5秒超时，每100毫秒，并发发送100个请求，总共执行150次，loadbalance策略为LeastActivity. Retry次数为1.

Provider 1：每个请求sleep 10毫秒

Provider 2：每个请求sleep 10秒

结果：

Consumer: 总调用次数:15000,成功次数:15000,错误次数:0,耗时:17975毫秒

Provider1: 执行总数为15000

Provider2: 执行总数为308

分析：案例1中错误总数和成功总数差不多一致，因为retry为0,50%请求发送到

provider2，发送错误的时候未重试

案例2中错误总数为0，但是耗时明显增长，花费了2分钟时间处理15000次请求。QPS下降。

案例3中错误总数为0，耗时为17秒，和预计的相近。

总结：leastactivity的loadbalance可以在发生故障的时候，保证QPS和可靠性。但是配置了leastactivity之后，权重的配置将会失效。建议配置重试次数，对于时耗短的应用，上级应用的超时时间要配置尽量短。

分享到：

Neo4j批量插入性能优化 | Dubbo不能优雅停机，导致停止服务的时候， ...

2015-11-14 23:05
浏览 1739
评论(0)
分类:开源软件
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

Least Activity LoadBalance配置

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

Least Activity LoadBalance配置

评论

发表评论

相关推荐

Dubbo不能优雅停机，导致停止服务的时候，业务掉单

最近访客更多访客>>