Dubbo 超时与重试的实现分析
来源:互联网 发布:sql语句升序 编辑:程序博客网 时间:2024/06/02 16:31
重试的实现
当消费端发起一次调用,如果集群容错模式选择的是FailoverCluster模式(缺省模式),当调用发生失败会自动发起切换,重试其它服务器。
<dubbo:reference> <dubbo:method name="findFoo" retries="2" /></dubbo:reference>
FailoverCluster模式的实现是在 com.alibaba.dubbo.rpc.cluster.support.FailoverClusterInvoker<T>
该类的实现如下,最终的调用是通过doInvoke方法完成。
public class FailoverClusterInvoker<T> extends AbstractClusterInvoker<T> { private static final Logger logger = LoggerFactory.getLogger(FailoverClusterInvoker.class); public FailoverClusterInvoker(Directory<T> directory) { super(directory); } @SuppressWarnings({ "unchecked", "rawtypes" }) public Result doInvoke(Invocation invocation, final List<Invoker<T>> invokers, LoadBalance loadbalance) throws RpcException { List<Invoker<T>> copyinvokers = invokers; checkInvokers(copyinvokers, invocation); int len = getUrl().getMethodParameter(invocation.getMethodName(), Constants.RETRIES_KEY, Constants.DEFAULT_RETRIES) + 1; if (len <= 0) { len = 1; } // retry loop. RpcException le = null; // last exception. List<Invoker<T>> invoked = new ArrayList<Invoker<T>>(copyinvokers.size()); // invoked invokers. Set<String> providers = new HashSet<String>(len); for (int i = 0; i < len; i++) { //重试时,进行重新选择,避免重试时invoker列表已发生变化. //注意:如果列表发生了变化,那么invoked判断会失效,因为invoker示例已经改变 if (i > 0) { checkWheatherDestoried(); copyinvokers = list(invocation); //重新检查一下 checkInvokers(copyinvokers, invocation); } Invoker<T> invoker = select(loadbalance, invocation, copyinvokers, invoked); invoked.add(invoker); RpcContext.getContext().setInvokers((List)invoked); try { Result result = invoker.invoke(invocation); if (le != null && logger.isWarnEnabled()) { logger.warn("Although retry the method " + invocation.getMethodName() + " in the service " + getInterface().getName() + " was successful by the provider " + invoker.getUrl().getAddress() + ", but there have been failed providers " + providers + " (" + providers.size() + "/" + copyinvokers.size() + ") from the registry " + directory.getUrl().getAddress() + " on the consumer " + NetUtils.getLocalHost() + " using the dubbo version " + Version.getVersion() + ". Last error is: " + le.getMessage(), le); } return result; } catch (RpcException e) { if (e.isBiz()) { // biz exception. throw e; } le = e; } catch (Throwable e) { le = new RpcException(e.getMessage(), e); } finally { providers.add(invoker.getUrl().getAddress()); } } throw new RpcException(le != null ? le.getCode() : 0, "Failed to invoke the method " + invocation.getMethodName() + " in the service " + getInterface().getName() + ". Tried " + len + " times of the providers " + providers + " (" + providers.size() + "/" + copyinvokers.size() + ") from the registry " + directory.getUrl().getAddress() + " on the consumer " + NetUtils.getLocalHost() + " using the dubbo version " + Version.getVersion() + ". Last error is: " + (le != null ? le.getMessage() : ""), le != null && le.getCause() != null ? le.getCause() : le); }}
首先获取使用者配置的重试次数,如果未配置,则默认为1。
int len = getUrl().getMethodParameter(invocation.getMethodName(), Constants.RETRIES_KEY, Constants.DEFAULT_RETRIES) + 1; if (len <= 0) { len = 1; }
接着通过循环完成重试调用。调用Result result = invoker.invoke(invocation);返回com.alibaba.dubbo.rpc.RpcResult,这个类内部封装了返回结果,抛出的异常,以及附件(attachments)信息。
private Object result; private Throwable exception; private Map<String, String> attachments = new HashMap<String, String>();
如果进行调用,服务方抛出异常,那么异常会记录在Result的exception成员中,如果调用时消费端检测到超时或网络异常等那么消费端将会抛出异常,并在如下代码中进行重试。
for (int i = 0; i < len; i++) { ...... ...... try { Result result = invoker.invoke(invocation); if (le != null && logger.isWarnEnabled()) { ...... } return result; } catch (RpcException e) { if (e.isBiz()) { // biz exception. throw e; } le = e; } catch (Throwable e) { le = new RpcException(e.getMessage(), e); } finally { providers.add(invoker.getUrl().getAddress()); } } throw new RpcException(le != null ? le.getCode() : 0, "Failed to invoke the method " + invocation.getMethodName() + " in the service " + getInterface().getName() + ". Tried " + len + " times of the providers " + providers + " (" + providers.size() + "/" + copyinvokers.size() + ") from the registry " + directory.getUrl().getAddress() + " on the consumer " + NetUtils.getLocalHost() + " using the dubbo version " + Version.getVersion() + ". Last error is: " + (le != null ? le.getMessage() : ""), le != null && le.getCause() != null ? le.getCause() : le);
当产生异常,且异常code为BIZ_EXCEPTION,那么也不会进行重试。
com.alibaba.dubbo.rpc.RpcException定义的异常Code有如下几种类型。
public static final int UNKNOWN_EXCEPTION = 0; public static final int NETWORK_EXCEPTION = 1; public static final int TIMEOUT_EXCEPTION = 2; public static final int BIZ_EXCEPTION = 3; public static final int FORBIDDEN_EXCEPTION = 4; public static final int SERIALIZATION_EXCEPTION = 5;
通过查看RpcException的setCode调用关系可以看到产BIZ_EXCEPTION的情况。
最后重试实现可总结为:通过循环重复调用方法,如果调用得到响应,则正常返回,产生的异常作为结果的成员。如果得不到响应如超时,网络异常,序列化失败等问题则去尝试重试。
超时的判断
在重试的实现中可以看到,进行方法调用最终是调用invoker的doInvoke方法完成最终调用。
例如:
com.alibaba.dubbo.rpc.protocol.dubbo.DubboInvoker.doInvoke(Invocation)
方法内部发出请求后通过future的get方法获取结果。
return (Result) currentClient.request(inv, timeout).get();
get记录开始时间start,然后不断循环检查是否得到了返回结果,如果在设定的超时时间内没有返回结果,那么跳出循环,并抛出超时异常。如果在指定的超时时间内得到响应则返回结果。
public Object get(int timeout) throws RemotingException { if (timeout <= 0) { timeout = Constants.DEFAULT_TIMEOUT; } if (! isDone()) { long start = System.currentTimeMillis(); lock.lock(); try { while (! isDone()) { done.await(timeout, TimeUnit.MILLISECONDS); if (isDone() || System.currentTimeMillis() - start > timeout) { break; } } } catch (InterruptedException e) { throw new RuntimeException(e); } finally { lock.unlock(); } if (! isDone()) { throw new TimeoutException(sent > 0, channel, getTimeoutMessage(false)); } } return returnFromResponse(); }
通过超时判定实现我们发现,当一个任务处理时间很久,而消费端配置的超时时间又很短就会出现消费端产生超时异常,而服务提供方却成功完成了操作的现象。因此对服务提供方的处理时间做出规划,配置合理的超时时间,或通过回调方法返回结果给消费端。这样避免消费端发生超时异常,而服务提供方处理完成的问题。
参考
dubbo 2.8.4 源码
- Dubbo 超时与重试的实现分析
- Dubbo的超时重试机制带来的数据重复问题
- Dubbo超时重试机制带来的数据重复问题
- Dubbo超时重试机制带来的数据重复问题
- 谨慎DUBBO超时时间和重试机制
- dubbo的重试机制
- resolv.conf 的超时(timeout)与重试(attempts)机制
- dubbo超时与超时后自动重复调用的问题
- dubbo超时与超时后自动重复调用的问题
- dubbo超时与超时后自动重复调用的问题
- HttpClient通过RetryHandler实现超时重试
- java重试工具库: 实现业务逻辑与重试逻辑的解耦
- Dubbo实现的源码分析
- 超时与重试机制(1)—《亿级流量》
- 超时与重试机制(1)—《亿级流量》
- 超时与重试机制(2)—《亿级流量》
- 超时,重试,熔断,限流
- socket 请求 超时重试
- Android--有序广播的实例解析--案例《拦截有序广播》
- 百度对新站的审核期是多久
- MySQL安装及遇到的问题
- install OpenSSL and rebuild ruby (preferred) or use non-HTTPS sources 和uninitialized constant Gem:
- Memory中的Channel/Rank/Bank解析
- Dubbo 超时与重试的实现分析
- 多线程知识点
- 短彩信的安全红线问题
- 利用Instrumentation单元测试模块控制安卓手机进行各项操作(微信)
- Java8集合源码解析-HashMap
- 网站分析
- pyspark开发环境搭建
- android sutdio版本和gradle版本的对应关系及as报错的处理Error:Failed to open zip file. Gradle's dependency cache ...
- 公有IP和私有IP介绍