如何通过Zipkin或Sk*walking实现链路追踪

前言

微服务架构将原先业务链条中的各个环节(节点或过程),如用户、产品、订单、支付拆分实现成独立的服务运行,一定程度上提高了系统的容错能力,例如支付服务失败时,用户依然可以通过产品及订单服务,达到查看订单和浏览产品的目的。随着微服务应用开发框架(如springboot)和容器技术(如K8)越来越成熟,微服务的开发和运维趋于标准化。这些都是微服务的愈发流行的原因。同时,随着业务复杂度的提高,越来越多的微服务被开发和集成进来,服务管理的重要性不言而喻。本文以服务调用的链路管理为题,浅谈微服务治理中链路管理的主流技术如何实践。

链路管理,主要指记录服务的调用链路,通常用来定位不合理的服务设计,如链路过长带来的服务耗时问题、链路过长带来的服务稳定性风险、循环依赖等。链路管理,需要考虑哪些方面的问题,如何实现?

  1. 首先,需要知道有哪些服务以及他们的服务状态(服务注册和发现机制),这个目前可以直接通过spring cloud的Eureka实现,当然也可以通过dubbo+zookeeper实现;
  2. 有了服务清单之后,我们需要在每个服务调用的地方拦截并记录,记录调用堆栈,从发起服务到链尾。这一步自己实现起来有较多的工作,譬如统一服务调用规则、AOP拦截、调用链数据结构定义、调用信息采集发送及存储等。
  3. 最后,是链路数据的采集、存储、发送以及最终的图形化展示。

有了这个思路之后,我们再来看目前主流的链路解决方案,Twitter的Zipkin,以及Apache的在孵化项目Skwalking。当然还有些比较热的方案,如韩国的开源项目Pinpoint和美团的CAT。这些方案从实现技术上大致可分为两个派系,拦截派,字节码增强派。拦截派做法通过代理类拦截请求,将链路信息发送给服务器,Zipkin和CAT都属于这种类型,不过CAT需要代码侵入,即代码中增加埋点,而Zipkin直接通过SpringCloud的Sleuth无缝对接SpringBoot的微服务。字节码增强技术,通过JVMTI接口提供的javaagent(区别于JDK动态代理和CGLIB代理),利用字节码操作技术(ASM),在类加载并实例化之前对class进行转换,之后运行中将信息采集并发送给代理服务器(探针),如skwalking的Agent服务。关于两种方式的比较,小结如下:

类型 zipkin sk*walking
基本原理 拦截请求,发送(HTTP,mq)数据至zipkin服务 java探针,字节码增强
接入方式 基于linkerd或者sleuth方式,引入配置即可 avaagent字节码
支持OpenTracing
颗粒度 接口级(类级别) 方法级
存储 ES,mysql,Cassandra,内存 ES,H2,TIDB
agent到collector的协议 http,MQ http,gRPC

Zipkin实践

Zipkin 分为两端,Zipkin 服务端和Zipkin 客户端,客户端也就是微服务的应用。客户端配置服务端的 URL 地址,一旦发生服务间的调用的时候,会被配置在微服务里面的 Sleuth 的监听器监听,并生成相应的 Trace 和 Span 信息发送给服务端。发送的方式主要有两种,一种是 HTTP 报文的方式,另一种是消息总线的方式如 RabbitMQ。

不论哪种方式,我们都需要:一个 Eureka 服务注册中心,先看下Zipkin运行架构:
如何通过Zipkin或Sk*walking实现链路追踪

左侧应用服务,同时也是Zipkin-clinet,Eureka-client, 中间是依赖,包括Zipkin-server和Eureka-server,最右侧是WebUI展示及开发接口。

Zipkin 的服务端,在使用 Spring Boot 2.x 版本后,官方就不推荐自行定制编译了,反而是直接提供了编译好的 jar 包来给我们使用。
所以官方提供了一键脚本

curl -sSL https://zipkin.io/quickstart.sh | bash -s
java -jar zipkin.jar

如果用 Docker 的话,直接
docker run -d -p 9411:9411 openzipkin/zipkin

这里使用docker环境测试。启动zipkinserver后,直接访问9411,看到管理页面:
如何通过Zipkin或Sk*walking实现链路追踪

zipkinserver启动后,启动EurekaServer,先本地启动一个,端口暂定为7777.
如何通过Zipkin或Sk*walking实现链路追踪

好了,现在依赖服务有了,接下来改造两个现有的微服务(为至少两个有调用关系的服务配置),作为zkclient。要做的事情很简单,下面几步:

  1. 配置EurekaClient

1)微服务增加zipkin依赖

compile "org.springframework.cloud:spring-cloud-starter-sleuth"
compile "org.springframework.cloud:spring-cloud-starter-zipkin"

2) 启动类增加EurekaClient注解
@EnableDiscoveryClient

3)application配置文件增加Eureka配置

eureka.instance.hostname=localhost
eureka.client.serviceUrl.defaultZone = http://${eureka.instance.hostname}:7777/eureka/
eureka.instance.preferIpAddress= true
  1. 配置Zipkin

1)开启sleuth client

spring.sleuth.web.client.enabled=true
spring.sleuth.sampler.percentage=1.0

2)配置zipkinserver地址
spring.zipkin.base-url=http://192.168.72.101:9411/

  1. 调用服务查看结果

1) Eureka服务清单
如何通过Zipkin或Sk*walking实现链路追踪

2) Zipkin服务链路
如何通过Zipkin或Sk*walking实现链路追踪

如何通过Zipkin或Sk*walking实现链路追踪

需要注意的是,由于Sleuth trace filter仅针对Spring内置的Rest调用做拦截,跨服务的调用需要使用Spring官宣方式,如RestTemplate,直接使用apache的httpclient工具包调用,是无法追踪到完整链路。

Sk*walking实践

相关文章
相关标签/搜索