java日志(log)使用笔记

文章目录

- - 为什么要打日志?
  - 日志分为哪几种
  - - （1）调试开发日志
    - （2）用户行为日志
    - （3）程序运行日志
    - （4）记录系统或者机器的状态
  - 运行日志可以反馈哪些信息
  - - (1) 通用信息
    - (2) 进度信息
    - (3) 异常信息
    - (4) 接口间的日志(传递唯一标识)
  - 每行日志都要带有uuid吗
  - 和的对比
  - 引入日志
- 日志的入参
- - 双object和objects的区别
  - 格式字符串(format)和直接字符串的区别
  - 性能提升方法
  - 通常哪些位置要加日志
  - - controller入参日志
    - 异常日志
    - 方法完成返回结果日志
  - 加日志的注意点
  - - 无用的日志
    - 还是无用的日志
    - 再来一个无用的日志
    - 没必要的日志
  - 很大的日志可以考虑不加，例如base64String
  - 返回报文里面也序列化入参
  - 为什么要日志优化
  - - 日志中不要有特殊字符
  - service中的日志和返回体
  - 微服务中日志的不足
  - - 场景
    - 解决方案
    - 能够记下主要接口在哪个应用中
  - requestId实现分布式的日志追踪
  - 日志中的行号找不到代码
  - 日志和返回体中写法不同
  - 日志中使用中括号
  - 日志的规范性
  - 规范性2
  - traceId的作用
  - 多线程日志如何打
  - 批量数据要不要日志
  - 日志中的低级错误
  - 占位符和入参哪个少了会报错
  - 日志和接口ResultJson的信息的区别：
  - 日志会影响效率吗
  - xshell日志工具
  - 区分业务日志和系统日志
  - 异常日志如何存库
  - 动态调整日志级别
  - traceId、spanId、parentSpanId的区别
  - - exec是什么线程

为什么要打日志?

日志是非常重要的，好的日志可以快速定位问题。
试想如果你一行日志也不打，服务器出现问题，是不是很麻爪。

日志分为哪几种

（1）调试开发日志

目的是开发期调试程序使用，这种日志量比较大，且没有什么实质性的意义，只应该出现在开发期，而不应该在项目上线之后输出。

（2）用户行为日志

这种类型的日志，记录用户的操作行为，用于大数据分析，比如监控、风控、推荐等等。这种日志，一般是给其他团队分析使用，而且可能是多个团队，因此一般会有一定的格式要求，开发者应该按照这个格式来记录，便于其他团队的使用。当然，要记录哪些行为、操作，一般也是约定好的，因此，开发者主要是执行的角色。这种日志，又叫事件上报，或埋点。

（3）程序运行日志

记录程序的运行状况，特别是非预期的行为、异常情况，这种日志，主要是给开发、维护人员使用。什么时候记录，记录什么内容，完全取决于开发人员，开发者具有高度自主性。本文讨论的主要也是指这种类型的日志，因为作为一个服务端开发、运维人员，程序运行日志往往是解决线上问题的救命稻草。

（4）记录系统或者机器的状态

比如网络请求、系统CPU、内存、IO使用情况等等，这种日志主要是给运维人员使用，生成各种更直观的展现形式，在系统出问题的时候报警。

运行日志可以反馈哪些信息

(1) 通用信息

时间，日志类型，所在类等。 (日志框架一般都带了)

(2) 进度信息

比如一个服务有5个步骤，是否开始这个服务。执行到了哪步等。

log.info("打开冰箱门");
log.info("把大象放进去");
log.info("关上冰箱门");

(3) 异常信息

log.error("什么操作发生了异常,异常信息为: "+e.toString())

这里要特别注意一点，如果记录了异常日志，不要继续抛出异常了。否则可能多次记录日志，因为其他位置可能还会捕获并记录。

注：该写error的日志，千万别写为info，因为error有个最重的功能就是传入e，会自动打印异常栈，而info必须显式的打印。

(4) 接口间的日志(传递唯一标识)

我在这台机器上调用服务，服务是在另外一台机器。所以需要传递唯一标识。可以传递一个uuid，便于找到问题所在。如代码：

String uuid = UUID.randomUUID().toString();
logger.error("保存操作异常,id为:{}，异常信息为:{}", uuid, e);
return new Result<>(ApiContants.ERROR,"id为: "+uuid);

这样我可能没有另一台服务的权限，但可以提供uuid给服务器的同事查问题。

每行日志都要带有uuid吗

每一行都带上更好，就是代码量稍多一些。

和的对比

效果基本相同，log有些前缀信息。

log.info("param1: {} , param2: {}, param3: {}",111,222,333);
String format = String.format("param1: %s , param2: %s, param3: %s", 111, 222, 333);

引入日志

private Logger logger = LoggerFactory.getLogger(OaSpringBootApplication.class);

日志的入参

可以使用格式字符串，用占用符替代参数。

Logger类定义的方法：

public void info(String msg); 
public void info(String format, Object arg);
public void info(String format, Object arg1, Object arg2);
public void info(String format, Object... arguments);
public void info(String msg, Throwable t);

例子：

logger.info("请求异常，异常code: "+"404"); // 直接打印，不使用占位符
logger.info("请求异常，异常code: {}","404"); // 使用格式字符串，1个入参
logger.info("请求异常，异常code: {} 异常msg：{}"+"404","找不到页面"); // 使用格式字符串，2个入参
logger.info("请求异常，异常code: {} 异常msg：{} requestUrl: {}"+"404","找不到页面","/user/login"); // 使用格式字符串，参数列表

// 下面例子和上面一样，就是多了个exception
logger.info("请求异常，异常code: "+"404",e);
logger.info("请求异常，异常code: {}","404",e);
logger.info("请求异常，异常code: {} 异常msg：{}"+"404","找不到页面",e);
logger.info("请求异常，异常code: {} 异常msg：{} requestUrl: {}"+"404","找不到页面","/user/login",e);

// exception不会消耗占位符，他会单独打印
//  第3个{} 不会匹配到e， 所以还是打印{}
logger.info("请求异常，异常code: {} 异常msg：{} 异常信息：{}"+"404","找不到页面",e);

双object和objects的区别

开始我也纳闷，双object不就是objects的一个特殊形式么。
后来看了源码才发现，有点区别。 objects会创建一个objects数组。会增加消耗。
但是双object的2个对象是独立的，性能更高。这也是把性能发挥到极致了。

public void info(String format, Object arg1, Object arg2);
public void info(String format, Object... arguments);

格式字符串(format)和直接字符串的区别

1、格式字符串可以使用占位符(这谁都知道)
2、看源码说，format还有个优点，就是如果日志级别不支持，不会创建对象。
这里说的不是传入的object对象，而是()对象。
例如，默认的级别是info，trace对象是不会创建的。可以还没想到如何验证。

logger.trace("请求异常，异常code: "+"404"); // 无论如何会创建trace对象
logger.trace("请求异常，异常code: {}",new Object()); // trace级别低于info，所以不创建trace对象，但是 new Object()这个对象是会创建的

性能提升方法

1、尽量使用格式字符串。(可以减少低级别的日志对象创建，但是对入参object无效)
2、能使用双object就不要用objects数组。(省略数组开销)
3、使用() 。尤其在入参比较大的时候，这种方法性能很高。

if(logger.isErrorEnabled()){
    logger.trace("请求异常，异常code: {}",new Object());
}

通常哪些位置要加日志

一般至少要说明以下信息：
发生了什么请求，入参是什么
成功了，返回值是
异常了，异常原因是

熟练使用日志还需要对业务非常熟悉才可以，否则都不知道该筛选什么日志。

controller入参日志

例如用户今天提交了个快递单，但是说他看不到。我在数据库查也没有。说明用户没有提交，或者是提交过程出错了。
如何排查呢：
1、那么先查info日志，看用户是否有提交的记录，如果没有日志，说明数据没有到后台。是不是前端出了问题。经查，app端出了问题。

controller里面最好要2条日志，入参日志，结果日志。调用的方法有日志，异常有日志，就实现了日志的全覆盖。
而且@RequestMapping 还可以设置name，很容易通过拦截器批量处理。

service层中的日志比较多样，这个可以手动掌握，更加的灵活。

异常日志

还是上述快递单的场景，info查到了入参日志，但是数据库没信息。
说明很有可能有异常了。经常，后台空指针异常了。

方法完成返回结果日志

还是订单问题。数据库没信息，info有出参日志，提示单据成功。但是数据库查不到啊。继续翻日志，发现还有一条删除记录的日志。说明用户提交了又删除了。所以查不到。

注：如果是逻辑中远程调用的结果，最好也打上日志。这样好找问题。

加日志的注意点

加日志尽量全，又要尽可能少。

无用的日志

如下日志就是没用的。如：

log.info("转账： {} 元",amount);

看不懂了，转账1000元，谁转的啊。虽然有日志，但是和没有一样。

还是无用的日志

 未获取对应的税号的期限！

谁呀，什么期限。谁也看不懂。
正确的方式：
1、未获取对应的税号666999的期限这样大家都能看懂。
如果有的税号没有期限记录，那么没法打印税号。也要提供线索。
2、票据123456未获取对应的税号期限这样也是可查的。

再来一个无用的日志

查询数据库数据，查询结果为空

这种日志在调试的时候，或许有点用。但是到了生产上就屁用没有。
在海洋般的日志里，没有检索特征无异于大海捞针。

正确的例子：

查询用户信息，查询结果为空，查询条件为：

没必要的日志

基础方法里面没必要写日志。
例如生成随机码的工具类，没有必要在这里加。而是应该加在调用它的controller里面。

很大的日志可以考虑不加，例如base64String

例如上传的图片要处理，转化为base64，要不要加日志?
不加，万一出问题怎么办。加日志，一行日志就上千行，其实可读性也很差。
这样大的日志其实可以考虑去掉。

返回报文里面也序列化入参

为了方便查询，返回报文里面也打印入参。
缺点：相当于入参打印了2遍，如果入参报文也比较多，那么很影响性能。
一个uuid贯穿比打2次入参方便很多。

为什么要日志优化

通常不会有这个问题，因为开发者只怕日志少，不怕日志多。
但是，如果经历过一天10G、甚至40G日志的场景，就能体会到了。
日志太大，即使一个简单的命令，捞数据效率也很慢，更别提复杂场景的数据捞取。
什么，拆分日志，40G的日志文件，即使1000M一个文件，也要拆分40个，要是100M一个，那要400个。是不是很崩溃。所以日志肯定不是越多越好。

日志中不要有特殊字符

单双引号，星号，右斜杠等最好都不要加。

另外还有：
不要有多个中划线，一个中划线是没问题的，多个就很尴尬。
例如日志为 “--------请求已开始” 。
那你 grep --------请求已开始看下。

service中的日志和返回体

需要日志么：
这个要看具体情况，主要是service的复杂度。如果一个service里面就一个dao，dao里面就一个mapper，那么没必要加。
如果service集成了很多的逻辑，作为一个单独的功能，那么是可以加的。

需要返回体么：
service也可大可小。如果一个service，包含了一个较大的功能，具备独立的code，message等，那么是可以配备返回体的。

微服务中日志的不足

日志虽然可以查看问题。但是如果在微服务中，查看日志还是有点捉襟见肘。

一种笨方法是：远程调用服务之前可以加是哪个远程服务的，这样跟踪的时候不蒙圈。

场景

应用由10个模块组成，每个模块双节点。出了问题，先从主应用日志找，再找具体某个模块。登录服务器需要堡垒机，最少要开4个shell窗口。相当头疼。

解决方案

方案一：
仅依靠看日志效率还是有点低，一天出几个问题，就够受的了。所以最好加入监控机制。
方案二：
其实springcloud中的slueth组件就是专门解决分布式日志的跟踪的。

能够记下主要接口在哪个应用中

应用有哪些主要接口是要了如指掌的。至少看到service要知道属于哪个应用。
还有流程的过程也要清楚，走了几个应用，都是什么方法。
否则看日志都不知道去哪个应用下看。

requestId实现分布式的日志追踪

微服务中，经常用到不只一个rpc服务。通过requestId可以贯穿整个流程。
requestId可以放在入参父类中，自动生成。
继续调用其他rpc的时候requestId也传递出去。接收方先判断是否有requestId，如果存在，就直接使用，不存在则生成。

日志中的行号找不到代码

其实一般是能找到的，这里需要注意下，日志的行号是输出日志的那一行，异常在哪一行是在堆栈信息那一行。
如下：
demo2：58 是这一行
demo2(:56) 是报错的行

2020-05-18 07:12:42.430 ERROR[http-nio-8080-exec-1]com.example.Demo.demo2:58 -error 
java.lang.ArithmeticException: / by zero
	at com.example.ModelController.demo2(ModelController.java:56)

日志和返回体中写法不同

日志中推荐使用占位符的写法。因为看起来更优雅，修改起来也方便。
返回体中推荐使用+号拼接字符串，因为JsonResult不具备解析占位符的功能。
正确的写法：

logger.info("修改信息成功 number: {}",request.getNumber());
return new JsonResult("0", "修改信息成功 number: "+request.getNumber()); // 注意这里是 + 号，不是逗号

错误的写法：

// 错误的写法 这里{}会原样输出。 number却会放到data中。 
return new JsonResult("0", "修改信息成功 number: {}",request.getNumber());

// 因为一般JsonResult构造器为这样:
public JsonResult(String code, String message, T data) {
    this.code = code;
    this.message = message;
    this.data = data;
}

日志中使用中括号

其实就是一种写法，为了便于删选：

# 这样就能删选出 中括号中的内容
grep "\[.*\]"

日志的规范性

要做到绝对规范挺难的，因为不同场景，日志要打印的格式也不同。
要一致性，一种思路是定义常量。但是都用常量的话，看起来反而不如文字清爽。
不用常量的话，就会有一个问题，日志描述越写花样越多，例如：

method收到请求，入参：
method入参

method完成
method成功

method异常

这里追求日志完全一模一样挺难的，但至少要有保证一点，能把事情描述清楚。

规范性2

例如controller中用"请求"：

请求开始，入参：
请求结束/完成/成功，返回报文：
请求失败，返回报文：

为了日志名称的一致性，@RequestMapping中可以设置下name属性，主要是为了复制起来方便。

@RequestMapping(value="getUser()",name="获取用户信息")
public User getUser(){
	
}

service中用"服务"

服务开始，入参：
服务结束/完成/成功，返回报文：
服务失败，返回报文：

主要就这2个了，dao里面一般不用日志的。

traceId的作用

1、多行不同的日志确定是同一个请求的。
2、跨服务之间日志的追踪。

多线程日志如何打

单线程根本不用指定uuid，因为日志工具一般都自带。
那么多线程为什么要打日志呢?
因为虽然有个主线程日志，可能会有及万行，根本不好筛选。

子线程难道没traceId吗?
有的。例如：

INFO  thread-1 asldfjaldjfla-asdfajsldkfjalkjf-asdfasdsf

很明显，是有子线程记录的。但是如果是2个线程池，会反复thread-1和thread-2，如果数据量大，还是不好筛选。所以要子线程id。

那么如何传递呢?
常用的两种方案。
方案一：final String sonUuid=“asldfjalkdjf”; 直接带过去。同理，其他参数也可以设置为final带过去。(线程中只允许直接带入final变量)
方案二：通过构造器带过去。

批量数据要不要日志

有的时候考虑到日志量会非常大，便不打日志，这是不对的。因为万一某条数据有纠纷，什么都查不到，这官司怎么打? 所以宁可麻烦一点，批量数据也想办法加上日志。如果不是特别多，可以一起加，量很大的话，可以循环加。
日志是肯定要的。

日志中的低级错误

还有一种情况要坚决避免，就是日志写错的情况。
例如：

修改机构成功  错写为 修改用户成功

这种低级错误实际中确实有发生，要细心些，坚决避免。

占位符和入参哪个少了会报错

这个比较好测试，代码如下：

// 入参少于占位符
LOGGER.info("requestid:{}，流水单导入收到请求：{}", 1 );
// 占位符少于入参
LOGGER.info("requestid:{}，流水单导入收到请求：{}", 1 ,2,3);

实测都不会报错。如果少了，打印不出来而已。

日志和接口ResultJson的信息的区别：

当然是有区别的，
1、日志要带上请求的名称，ResultJson不用。
2、日志要加上，返回报文、返回信息这样的字段，ResultJson不用。

至于占位符，都是可以使用的，因为有MessageFormat工具。

日志会影响效率吗

一般来说，单条日志的耗时是1ms级别甚至更少。
所以一个请求，有二三十条日志也不碍事。

只要日志打印的不是特别夸张的对象就行。例如一个超大的对象，几万行的json等。

xshell日志工具

简单说就是将日志结果保存到自己电脑上。
右键 | 日志 | 启动，然后弹出一个保存文件的对话框，选个文件就是日志输出的文件，所有的操作及返回都会打印到这个文件里。
如果不用了，右键 | 日志 | 停止即可。

缺点：因为要写日志到文件，所以稍微影响点效率。

区分业务日志和系统日志

可以通过定义不同的appender，然后在代码里面引用需要的appender即可。

private static final Logger businessLog = LoggerFactory.getLogger("businessAppend");

异常日志如何存库

打印日志很简单，
(“error：”,e)； // 注： error日志不用加{}，否则反而抓不到。

但是如果记录下详细的堆栈信息呢? 用()就行吧?
实测原生的不行。那么怎么办呢?
不用担心，有现成的类库可以解决。

logger.info("testError请求异常，error：", e);

工具类的方法：
String stackTrace = ExceptionUtils.getStackTrace(e);
String message = ExceptionUtils.getMessage(e);
Throwable rootCause = ExceptionUtils.getRootCause(e);
logger.info("stackTrace：{}",stackTrace);
logger.info("message：{}",message);
logger.info("rootCause：{}",rootCause);

原生的方法：
logger.info("()：{}",JSON.toJSONString(e.getCause()));
logger.info("()：{}",e.getMessage());
logger.info("()：{}",JSON.toJSONString(e.getLocalizedMessage()));
logger.info("()：{}",JSON.toJSONString(e.getStackTrace()));

动态调整日志级别

其实actuator就行，详见笔者actuator使用笔记。

traceId、spanId、parentSpanId的区别

刚看到的时候有点蒙，为什么是三段式呢?一个uuid不就够了吗?
后来才明白这是分布式的日志概念。

例如：

结构：
traceId-spanId-parentSpanId

例子：
afa3a75ebd7d0439-7b57df10e16a0ec6-afa3a75ebd7d0439

参考下别人的说法：

traceId : 在一个链路中 traceId 唯一
spanId : 同一个线程中唯一, 从0始，按照调用链路从0递增
parentSpanId : 在同一个线程的链路中，用来连接 span
segmentId : 同一个线程链路中，这个值都是相同的，不同线程链路中这个值不同

traceId 倒好理解。
spanId为什么没有按照规则呢? 7b57df10e16a0ec6这个是第几级的调用呢?
parentSpanId值为什么和traceId一致，什么时候不一致呢?

exec是什么线程

日志里看到这个线程，但是不知道是什么?

2024-12-02 16:39:31,668 [http-nio-8081-exec-522] INFO   - 执行sql耗时:2 ms

注：实际已经很明显了，http-nio的就是tomcat自带的线程前缀，表示这是个请求，所以不用猜是哪个定时任务调用的了，应该是请求。