前言
随着应用愈发复杂,请求的链路也愈发复杂,微服务化下,更是使得不同的服务分布在不同的机器,地域,语言也不尽相同。因此需要借助工具帮助分析,跟踪,定位请求中出现的若干问题,以此来保障服务治理,链路追踪也就出现了。
OpenTracing协议
OpenTracing是一套分布式追踪协议,与平台,语言、厂商无关的Trace协议,统一接口,使得开发人员能够方便的添加或更换更换不同的分布式追踪系统。
同样作为分布式追踪协议的还有OpenCensus,以及两者的合并体OpenTelemetry。
Jaeger介绍
Jaeger[ˈdʒɛgər]是Uber推出的一款开源分布式追踪系统,兼容OpenTracing API,已在Uber大规模使用,且已加入CNCF开源组织(Cloud Native Computing Foundation-云原生计算基金会)。其主要功能是聚合来自各个异构系统的实时监控数据。
Jager提供了一套完整的追踪系统包括Jaeger-client、Jaeger-agent、Jaeger-collector、Database和Jaeger-query UI等基本组件。
- Jaeger-client:为不同开发语言实现了符合OpenTracing协议的客户端。
- Jaeger-agent:一个监听在UDP端口上接收链路数据的网络守护进程,它从应用程序收集,批处理,并发送给Collector,(也可以没有这个,client直接上报)。
- Jaeger-collector:负责接收Jaeger-client或Jaeger-agent上报的调用链路数据,并通过处理管道运行它们,该管道验证跟踪、对它们进行索引、执行任何转换并最终保存到内存或外部存储系统中,供UI展示。
- Jaeger-query:查询服务从存储中检索跟踪并呈现 UI 来显示它们。
Jaeger安装
在个人使用或者测试上,Jaeger提供了jaegertracing/all-in-one镜像,搭建过程十分简单,数据存储在内存中,但需要注意容器挂了后数据就没了。
docker run -d -p 6831:6831/udp -p 16686:16686 jaegertracing/all-in-one:latest
创建容器运行后,可以访问ip:16686查看Jaeger的仪表面板
Jaeger应用
服务设计
简化大部分服务设计,整个结构上差不多是如下所示,服务层常见金字塔结构,服务上下游明确,以避免服务间的循环依赖。
此处建立四个服务以及一个BFF网关层,以满足服务同步调用,服务间上下游调用,以及服务间事件通信。
- JaegerDemo.BFF.Host
- JaegerDemo.AService.Host
- JaegerDemo.BService.Host
- JaegerDemo.CService.Host
- JaegerDemo.DService.Host
为这几个服务设定期望如下
- 执行Get请求时,从Gateway调用,请求A服务,在同步请求B和C服务,拿到结果组装后对外返回。
- 执行Post请求时,从Gateway调用,请求A服务,在发布事件到MQ中,D服务订阅事件,数据写入到Sqlite中。
Nuget包引用
- Jaeger,用来上传数据到Jaeger。
- OpenTracing.Contrib.NetCore,基于OpenTracing.Net的增强,用来采集应用数据。
- MassTransit和MassTransit.RabbitMQ,用来完成事件的发布订阅。
<ItemGroup>
<PackageReference Include="OpenTracing" Version="0.12.1" />
<PackageReference Include="Jaeger" Version="1.0.3" />
<PackageReference Include="MassTransit" Version="8.0.8" />
<PackageReference Include="MassTransit.RabbitMQ" Version="8.0.8" />
</ItemGroup>
服务注册
将服务注册到容器中,设置上报地址,注意此处上报地址是UDP类型,因此在云服务器中开安全组时需要是UDP类型
builder.Services.AddOpenTracing();
builder.Services.AddSingleton<ITracer>(serviceProvider =>
{
var serviceName = serviceProvider.GetRequiredService<IWebHostEnvironment>().ApplicationName;
var loggerFactory = serviceProvider.GetRequiredService<ILoggerFactory>();
var sampler = new ConstSampler(sample: true);
var reporter = new RemoteReporter.Builder()
.WithLoggerFactory(loggerFactory)
.WithSender(new UdpSender("xxx.xxx.xxx.xxx", 6831, 0))
.Build();
var tracer = new Tracer.Builder(serviceName)
.WithLoggerFactory(loggerFactory)
.WithSampler(sampler)
.WithReporter(reporter)
.Build();
GlobalTracer.Register(tracer);
return tracer;
});
此处我在云服务器中开放6831的端口,注意是UDP
Http请求
在BFF处发起Http调用A服务,以及A服务发起Http调用B和C。
[HttpGet]
public async Task<string> GetAsync()
{
using var httpClient = _httpClientFactory.CreateClient();
httpClient.BaseAddress = new Uri("https://localhost:7001");
var aServiceResult = await httpClient.GetStringAsync("/AValue");
return aServiceResult;
}
请求发送完毕,从Jaeger的仪表面板查看监控数据,能够看到一个请求的发起时间,所经过的服务数量、所调用服务的依赖关系、消耗的时长等信息。整个请求链路也就看到了,B和C的同步请求,A和B,A和C的上下游请求也明了。
Jaeger提供了有向图描述请求链路,来方便理清节点间的通信边界,整个请求链路也便清晰了。
事件驱动
在BFF处发起Http调用A服务,以及A服务往RabbitMQ发送集成事件。
[HttpPost]
public async Task<IActionResult> CreateAsync(string value)
{
var actionName = ControllerContext.ActionDescriptor.DisplayName;
using var scope = _tracer.BuildSpan(actionName).StartActive(finishSpanOnDispose: true);
var span = scope.Span.SetTag(Tags.SpanKind, Tags.SpanKindClient);
var dictionary = new Dictionary<string, string>();
_tracer.Inject(span.Context, BuiltinFormats.TextMap, new TextMapInjectAdapter(dictionary));
// Do something
// ...
// Send integration event
await _publishEndpoint.Publish(new ValueCreatedIntegrationEvent()
{
Value = value,
TrackingKeys = dictionary
});
return Ok();
}
D服务中消费集成事件,并写入Sqlite库中
public async Task Consume(ConsumeContext<ValueCreatedIntegrationEvent> context)
{
using var scope = TracingExtension.StartServerSpan(_tracer, context.Message.TrackingKeys, "Value created integration event handler");
var value = context.Message.Value;
Console.WriteLine($"Value:{value}");
await _dbContext.ValueAggregates.AddAsync(new ValueAggregate(value));
await _dbContext.SaveChangesAsync();
}
当请求发送完毕,事件消费完毕后,可以在Jaeger上看到在事件驱动下的链路调用过程,以及在调用过程中增加的tags和logs,写入Sqlite的Sql。
在原有链路结构上,便又多了一个D服务。
参考
- https://developer.aliyun.com/article/514488
- https://www.cnblogs.com/wucy/p/13642289.html
- https://www.cnblogs.com/catcher1994/p/10662999.html
2022-11-28,望技术有成后能回来看见自己的脚步