分类 Java 下的文章

0、无法连接jvm

错误信息如下:

com.sun.tools.attach.AttachNotSupportedException: Unable to open socket file: target process not responding or HotSpot VM not loaded
    at sun.tools.attach.LinuxVirtualMachine.<init>(LinuxVirtualMachine.java:106)
    at sun.tools.attach.LinuxAttachProvider.attachVirtualMachine(LinuxAttachProvider.java:78)
    at com.sun.tools.attach.VirtualMachine.attach(VirtualMachine.java:250)
    at com.taobao.arthas.core.Arthas.attachAgent(Arthas.java:85)
    at com.taobao.arthas.core.Arthas.<init>(Arthas.java:28)
    at com.taobao.arthas.core.Arthas.main(Arthas.java:123)
[ERROR] attach fail, targetPid: 6958

排查思路如下:

  1. 目标pid是否正确,可以通过jps或ps进行确认
  2. 观察pid的执行用户是否和执行arthas的用户一致,比如常见的跑jvm的是tomcat用户,但是登录用户并不是

- 阅读剩余部分 -

重新定义七点半,不知道你有没有听过这个梗。
我不知道这个梗最初是来源于哪里,我第一次见是在老罗的发布会,因为老罗的发布会总会有各种各样的问题,说是七点半开,从来没有准时过,所以说,“重新定义了七点半”。

前面几篇都讲了怎么去获取数据(参数、静态字段、返回值、执行时间、执行链路),或者怎么去执行方法(静态方法、获取实例调用方法)。

这篇就说一个大招,怎么在运行时去修改代码。

0、前置工作

有下面这样一个接口,获取开始时间:


package com.chengjf.snippet.spring.mvc.service;

public interface HelloService {
    
    /**
     * 获取开始时间
     *
     * @return
     */
    String getStartTime();
}

实现是直接返回开始时间“七点半”:

package com.chengjf.snippet.spring.mvc.service.impl;

@Service
public class HelloServiceImpl implements HelloService {
    @Override
    public String getStartTime() {
        return "七点半";
    }
}

然后整个controller调用这个getStartTime方法:

@RequestMapping("startTime")
public Object getStartTime() {
    HashMap<Object, Object> objectObjectHashMap = Maps.newHashMap();
    String result = helloService.getStartTime();
    objectObjectHashMap.put("startTime", result);
    return objectObjectHashMap;
}

返回就是说好的“七点半”:

{
    "startTime": "七点半"
}

- 阅读剩余部分 -

本篇让我来体验一下ognl的强大魔法。

有这么一个场景,你的接口中有这么一个方法,清除所有的东东,让数据走上正轨。但是这个方法,你没有在后台管理系统调用,导致你现在无法调用这个方法来清除数据。

你现在怒火攻心,心急如焚,像热锅上的蚂蚁--团团转。

这个时候,ognl就派上大用场了。

但是ognl需要一个关键的对象,就是你的接口实现的对象实例,有了一个对象实例,才可以去调用这个实例的方法。那么怎么获取这个对象实例呢?

有两个方法,我来一一介绍。

一、watch命令

使用watch命令获取,watch命令里可以获取到当前观测的类实例,使用参数target就可以获取到这个类实例。

但是想被watch抓到需要其他方法触发,选择一个有http接口调用的方法作触发即可。比如下面使用sayHello方法。

watch com.chengjf.snippet.spring.mvc.service.HelloService sayHello "{target}" -x 10

结果如下:

获取到这个target,就可以调用这个target的方法了。

watch com.chengjf.snippet.spring.mvc.service.HelloService sayHello "{target.clear()}" -x 10

结果如下:

上线这个命令有个问题,就是sayHello这个方法执行多少次,那么这个clear方法就要执行多少次,这个明显不是我想要的。当然你可以在这个命令执行一次后,就马上CTRL+C结束掉。但是这个watch有个-n参数指定执行次数明显更方便一点。

watch com.chengjf.snippet.spring.mvc.service.HelloService sayHello "{target.clear()}" -x 10 -n 1

结果如下:

二、tt命令+ognl命令

tt(TimeTunnel)命令的官方说明:方法执行数据的时空隧道,记录下指定方法每次调用的入参和返回信息,并能对这些不同的时间下调用进行观测。

这个命令最厉害的是可以记录方法执行的时的现场,这样我们就可以获取到执行的对象实例了。

tt -t com.chengjf.snippet.spring.mvc.service.HelloService sayHello

调用sayHello的http接口触发,结果如下:

前面这个index,就是这个方法执行现场的编号,可以使用这个编号就行时空回溯:

tt -i 1000 -w "{target.clear()}"

结果如下:

使用-l参数可以获取到所有记录的现场:

tt -l

结果如下:

首先,有这么一个接口

package com.chengjf.snippet.spring.mvc.service;

/**
 * @author jeff.cheng
 * @date 2019-10-30 09:31
 */
public interface HelloService {

    /**
     * say hello
     *
     * @param name
     * @return
     */
    String sayHello(String name);
}

然后实现如下,里面有两个static字段,分别是HELLO_PREFIX和HELLO_SUFFIX:

package com.chengjf.snippet.spring.mvc.service.impl;

import com.chengjf.snippet.spring.mvc.service.HelloService;
import org.springframework.stereotype.Service;

/**
 * @author jeff.cheng
 * @date 2019-10-30 09:32
 */
@Service
public class HelloServiceImpl implements HelloService {

    private static String HELLO_PREFIX = "Hello, ";
    private static String HELLO_SUFFIX = "!";

    @Override
    public String sayHello(String name) {
        return HELLO_PREFIX + name + HELLO_SUFFIX;
    }
}

可以使用getstatic方法获取到static字段的值:

getstatic com.chengjf.snippet.spring.mvc.service.impl.HelloServiceImpl HELLO_PREFIX

结果如下:

可以传入通配符获取该类的所有static字段

getstatic com.chengjf.snippet.spring.mvc.service.impl.HelloServiceImpl *

结果如下:

arthas提供了ognl这个强大的工具,也可以用来获取static字段:

ognl "@com.chengjf.snippet.[email protected]_PREFIX"

结果如下:

但是ognl的功能远不止如此,还可以修改static字段的值:

ognl "#[email protected]@class,#f=#c.getDeclaredField('HELLO_PREFIX'),#f.setAccessible(true),#f.set(#c,'123')"

结果如下:

查询一下,会发现值已经被修改了:

只想上面这段命令就将HELLO_PREFIX这个static字段修改成了123。下面来看下这个命令:

  1. #[email protected]@class,获取HelloServiceImpl这个class
  2. #f=#c.getDeclaredField('HELLO_PREFIX'),获取Field
  3. #f.setAccessible(true),设置Field的修改性
  4. #f.set(#c,'123'),修改字段的值为123

一、追踪方法执行流程和耗时

使用trace命令可以列出目标方法执行时的调用链以及耗时。有如下两个作用:

  1. 可以排查执行流程,特别是当代码中有各种if/else的时候,可以协助看下到底是执行了哪些方法
  2. 可以排查执行耗时,找出消耗时间最多的方法,进行优化

比如:

trace com.chengjf.snippet.spring.mvc.controller.IndexController index

结果如下:

二、获取方法执行时的参数和返回值或异常

如果方法缺少日志进行排查,可以使用watch命令可以实时看到这些。

watch com.chengjf.snippet.spring.mvc.controller.IndexController hello "{params,returnObj,throwExp,isReturn,isThrow}"

结果如下:

当参数或返回值的对象层次较深导致无法查看到内部的数据时,可以加上-x参数指定深度:

watch com.chengjf.snippet.spring.mvc.controller.IndexController hello "{params,returnObj,throwExp,isReturn,isThrow}" -x 10

结果如下:

如果要排查的方法被调用次数很多,无法准确排查或排查难度较大,可以进行过滤。

首先,可以指定你想要的参数:

watch com.chengjf.snippet.spring.mvc.controller.IndexController hello "{params,returnObj,throwExp,isReturn,isThrow}" 'params[0]=="world"' -x 10

watch com.chengjf.snippet.spring.mvc.controller.IndexController hello "{params,returnObj,throwExp,isReturn,isThrow}" 'params[1]==10' -x 10

可以组合使用:

watch com.chengjf.snippet.spring.mvc.controller.IndexController hello "{params,returnObj,throwExp,isReturn,isThrow}" 'params[0]=="world" && params[1]==10' -x 10

watch com.chengjf.snippet.spring.mvc.controller.IndexController hello "{params,returnObj,throwExp,isReturn,isThrow}" 'params[0]=="world" || params[1]==10' -x 10

如果参数是对象,还可以直接使用field:

watch com.chengjf.snippet.spring.mvc.controller.IndexController test "{params,returnObj,throwExp,isReturn,isThrow}" 'params[0].name=="world"' -x 10

对返回值也是一样的:

watch com.chengjf.snippet.spring.mvc.controller.IndexController test "{params,returnObj,throwExp,isReturn,isThrow}" 'returnObj.age==99' -x 10

三、获取方法执行的统计信息

使用monitor可以获取方法的统计信息,包括执行次数,成功次数,失败次数,平均耗时以及失败率。

其中,-c参数可以指定监控周期,默认是60s。

monitor com.chengjf.snippet.spring.mvc.controller.IndexController * -c 10

结果如下: