MyBatis 源码分析 - SQL 的执行过程

* 本文速览

本篇文章较为详细的介绍了 MyBatis 执行 SQL 的过程。该过程本身比较复杂，牵涉到的技术点比较多。包括但不限于 Mapper 接口代理类的生成、接口方法的解析、SQL 语句的解析、运行时参数的绑定、查询结果自动映射、延迟加载等。本文对所列举的技术点，以及部分未列举的技术点都做了较为详细的分析。全文篇幅很大，需要大家耐心阅读。下面来看一下本文的目录：

源码分析类文章通常比较枯燥。因此，我在分析源码的过程中写了一些示例，同时也绘制了一些图片。希望通过这些示例和图片，帮助大家理解 MyBatis 的源码。

MyBatis 源码分析 - SQL 的执行过程

本篇文章篇幅很大，全文字数约 26000 字，阅读时间预计超过 100 分钟。通读本文可能会比较累，大家可以分次阅读。好了，本文的速览就先到这，下面进入正文。

1.简介

在前面的文章中，我分析了配置文件和映射文件的解析过程。经过前面复杂的解析过程后，现在，MyBatis 已经进入了就绪状态，等待使用者发号施令。本篇文章我将分析MyBatis 执行 SQL 的过程，该过程比较复杂，涉及的技术点很多。包括但不限于以下技术点：

为 mapper 接口生成实现类
根据配置信息生成 SQL，并将运行时参数设置到 SQL 中
一二级缓存的实现
插件机制
数据库连接的获取与管理
查询结果的处理，以及延迟加载等

如果大家能掌握上面的技术点，那么对 MyBatis 的原理将会有很深入的理解。若将以上技术点一一展开分析，会导致文章篇幅很大，因此我打算将以上知识点分成数篇文章进行分析。本篇文章将分析以上列表中的第1个、第2个以及第6个技术点，其他技术点将会在随后的文章中进行分析。好了，其他的就不多说了，下面开始我们的源码分析之旅。

2.SQL 执行过程分析

2.1 SQL 执行入口分析

在单独使用 MyBatis 进行数据库操作时，我们通常都会先调用 SqlSession 接口的 getMapper 方法为我们的 Mapper 接口生成实现类。然后就可以通过 Mapper 进行数据库操作。比如像下面这样：

ArticleMapper articleMapper = session.getMapper(ArticleMapper.class);

Article article = articleMapper.findOne(1);

如果大家对 MyBatis 较为理解，会知道 SqlSession 是通过 JDK 动态代理的方式为接口生成代理对象的。在调用接口方法时，方法调用会被代理逻辑拦截。在代理逻辑中可根据方法名及方法归属接口获取到当前方法对应的 SQL 以及其他一些信息，拿到这些信息即可进行数据库操作。

上面是一个简版的 SQL 执行过程，省略了很多细节。下面我们先按照这个简版的流程进行分析，首先我们来看一下 Mapper 接口的代理对象创建过程。

2.1.1 为 Mapper 接口创建代理对象

本节，我们从 DefaultSqlSession 的 getMapper 方法开始看起，如下：

// -☆- DefaultSqlSession

public <T> T getMapper(Class<T> type) {

    return configuration.<T>getMapper(type, this);

}

// -☆- Configuration

public <T> T getMapper(Class<T> type, SqlSession sqlSession) {

    return mapperRegistry.getMapper(type, sqlSession);

}

// -☆- MapperRegistry

public <T> T getMapper(Class<T> type, SqlSession sqlSession) {

    // 从 knownMappers 中获取与 type 对应的 MapperProxyFactory

    final MapperProxyFactory<T> mapperProxyFactory = (MapperProxyFactory<T>) knownMappers.get(type);

    if (mapperProxyFactory == null) {

        throw new BindingException("Type " + type + " is not known to the MapperRegistry.");

    }

    try {

        // 创建代理对象

        return mapperProxyFactory.newInstance(sqlSession);

    } catch (Exception e) {

        throw new BindingException("Error getting mapper instance. Cause: " + e, e);

    }

}

如上，经过连续的调用，Mapper 接口代理对象的创建逻辑初现端倪。如果没看过我前面的分析文章，大家可能不知道 knownMappers 集合中的元素是何时存入的。这里再说一遍吧，MyBatis 在解析配置文件的 <mappers> 节点的过程中，会调用 MapperRegistry 的 addMapper 方法将 Class 到 MapperProxyFactory 对象的映射关系存入到 knownMappers。具体的代码就不分析了，大家可以阅读我之前写的文章，或者自行分析相关的代码。

在获取到 MapperProxyFactory 对象后，即可调用工厂方法为 Mapper 接口生成代理对象了。相关逻辑如下：

// -☆- MapperProxyFactory

public T newInstance(SqlSession sqlSession) {

    /*

     * 创建 MapperProxy 对象，MapperProxy 实现了

     * InvocationHandler 接口，代理逻辑封装在此类中

     */

    final MapperProxy<T> mapperProxy = new MapperProxy<T>(sqlSession, mapperInterface, methodCache);

    return newInstance(mapperProxy);

}

protected T newInstance(MapperProxy<T> mapperProxy) {

    // 通过 JDK 动态代理创建代理对象

    return (T) Proxy.newProxyInstance(mapperInterface.getClassLoader(), new Class[]{mapperInterface}, mapperProxy);

}

上面的代码首先创建了一个 MapperProxy 对象，该对象实现了 InvocationHandler 接口。然后将对象作为参数传给重载方法，并在重载方法中调用 JDK 动态代理接口为 Mapper 生成代理对象。

到此，关于 Mapper 接口代理对象的创建过程就分析完了。现在我们的 ArticleMapper 接口指向的代理对象已经创建完毕，下面就可以调用接口方法进行数据库操作了。由于接口方法会被代理逻辑拦截，所以下面我们把目光聚焦在代理逻辑上面，看看代理逻辑会做哪些事情。

2.1.2 执行代理逻辑

在 MyBatis 中，Mapper 接口方法的代理逻辑实现的比较简单。该逻辑首先会对拦截的方法进行一些检测，以决定是否执行后续的数据库操作。对应的代码如下：

public Object invoke(Object proxy, Method method, Object[] args) throws Throwable {

    try {

        // 如果方法是定义在 Object 类中的，则直接调用

        if (Object.class.equals(method.getDeclaringClass())) {

            return method.invoke(this, args);

        /*

         * 下面的代码最早出现在 mybatis-3.4.2 版本中，用于支持 JDK 1.8 中的

         * 新特性 - 默认方法。这段代码的逻辑就不分析了，有兴趣的同学可以

         * 去 Github 上看一下相关的相关的讨论（issue #709），链接如下：

         *

         *   https://github.com/mybatis/mybatis-3/issues/709

         */

        } else if (isDefaultMethod(method)) {

            return invokeDefaultMethod(proxy, method, args);

        }

    } catch (Throwable t) {

        throw ExceptionUtil.unwrapThrowable(t);

    }

    // 从缓存中获取 MapperMethod 对象，若缓存未命中，则创建 MapperMethod 对象

    final MapperMethod mapperMethod = cachedMapperMethod(method);

    // 调用 execute 方法执行 SQL

    return mapperMethod.execute(sqlSession, args);

}

如上，代理逻辑会首先检测被拦截的方法是不是定义在 Object 中的，比如 equals、hashCode 方法等。对于这类方法，直接执行即可。除此之外，MyBatis 从 3.4.2 版本开始，对 JDK 1.8 接口的默认方法提供了支持，具体就不分析了。完成相关检测后，紧接着从缓存中获取或者创建 MapperMethod 对象，然后通过该对象中的 execute 方法执行 SQL。在分析 execute 方法之前，我们先来看一下 MapperMethod 对象的创建过程。MapperMethod 的创建过程看似普通，但却包含了一些重要的逻辑，所以不能忽视。

2.1.2.1 创建 MapperMethod 对象

本节来分析一下 MapperMethod 的构造方法，看看它的构造方法中都包含了哪些逻辑。如下：

public class MapperMethod {

    private final SqlCommand command;

    private final MethodSignature method;

    public MapperMethod(Class<?> mapperInterface, Method method, Configuration config) {

        // 创建 SqlCommand 对象，该对象包含一些和 SQL 相关的信息

        this.command = new SqlCommand(config, mapperInterface, method);

        // 创建 MethodSignature 对象，从类名中可知，该对象包含了被拦截方法的一些信息

        this.method = new MethodSignature(config, mapperInterface, method);

    }

}

如上，MapperMethod 构造方法的逻辑很简单，主要是创建 SqlCommand 和 MethodSignature 对象。这两个对象分别记录了不同的信息，这些信息在后续的方法调用中都会被用到。下面我们深入到这两个类的构造方法中，探索它们的初始化逻辑。

① 创建 SqlCommand 对象

前面说了 SqlCommand 中保存了一些和 SQL 相关的信息，那具体有哪些信息呢？答案在下面的代码中。

public static class SqlCommand {

    private final String name;

    private final SqlCommandType type;

    public SqlCommand(Configuration configuration, Class<?> mapperInterface, Method method) {

        final String methodName = method.getName();

        final Class<?> declaringClass = method.getDeclaringClass();

        // 解析 MappedStatement

        MappedStatement ms = resolveMappedStatement(mapperInterface, methodName, declaringClass, configuration);

        // 检测当前方法是否有对应的 MappedStatement

        if (ms == null) {

            // 检测当前方法是否有 @Flush 注解

            if (method.getAnnotation(Flush.class) != null) {

                // 设置 name 和 type 遍历

                name = null;

                type = SqlCommandType.FLUSH;

            } else {

                /*

                 * 若 ms == null 且方法无 @Flush 注解，此时抛出异常。

                 * 这个异常比较常见，大家应该眼熟吧

                 */

                throw new BindingException("Invalid bound statement (not found): "

                    + mapperInterface.getName() + "." + methodName);

            }

        } else {

            // 设置 name 和 type 变量

            name = ms.getId();

            type = ms.getSqlCommandType();

            if (type == SqlCommandType.UNKNOWN) {

                throw new BindingException("Unknown execution method for: " + name);

            }

        }

    }

}

如上，SqlCommand 的构造方法主要用于初始化它的两个成员变量。代码不是很长，逻辑也不难理解，就不多说了。继续往下看。

② 创建 MethodSignature 对象

MethodSignature 即方法签名，顾名思义，该类保存了一些和目标方法相关的信息。比如目标方法的返回类型，目标方法的参数列表信息等。下面，我们来分析一下 MethodSignature 的构造方法。

public static class MethodSignature {

    private final boolean returnsMany;

    private final boolean returnsMap;

    private final boolean returnsVoid;

    private final boolean returnsCursor;

    private final Class<?> returnType;

    private final String mapKey;

    private final Integer resultHandlerIndex;

    private final Integer rowBoundsIndex;

    private final ParamNameResolver paramNameResolver;

    public MethodSignature(Configuration configuration, Class<?> mapperInterface, Method method) {

        // 通过反射解析方法返回类型

        Type resolvedReturnType = TypeParameterResolver.resolveReturnType(method, mapperInterface);

        if (resolvedReturnType instanceof Class<?>) {

            this.returnType = (Class<?>) resolvedReturnType;

        } else if (resolvedReturnType instanceof ParameterizedType) {

            this.returnType = (Class<?>) ((ParameterizedType) resolvedReturnType).getRawType();

        } else {

            this.returnType = method.getReturnType();

        }

        // 检测返回值类型是否是 void、集合或数组、Cursor、Map 等

        this.returnsVoid = void.class.equals(this.returnType);

        this.returnsMany = configuration.getObjectFactory().isCollection(this.returnType) || this.returnType.isArray();

        this.returnsCursor = Cursor.class.equals(this.returnType);

        // 解析 @MapKey 注解，获取注解内容

        this.mapKey = getMapKey(method);

        this.returnsMap = this.mapKey != null;

        /*

         * 获取 RowBounds 参数在参数列表中的位置，如果参数列表中

         * 包含多个 RowBounds 参数，此方法会抛出异常

         */

        this.rowBoundsIndex = getUniqueParamIndex(method, RowBounds.class);

        // 获取 ResultHandler 参数在参数列表中的位置

        this.resultHandlerIndex = getUniqueParamIndex(method, ResultHandler.class);

        // 解析参数列表

        this.paramNameResolver = new ParamNameResolver(configuration, method);

    }

}

上面的代码用于检测目标方法的返回类型，以及解析目标方法参数列表。其中，检测返回类型的目的是为避免查询方法返回错误的类型。比如我们要求接口方法返回一个对象，结果却返回了对象集合，这会导致类型转换错误。关于返回值类型的解析过程先说到这，下面分析参数列表的解析过程。

public class ParamNameResolver {

    private static final String GENERIC_NAME_PREFIX = "param";

    private final SortedMap<Integer, String> names;

    public ParamNameResolver(Configuration config, Method method) {

        // 获取参数类型列表

        final Class<?>[] paramTypes = method.getParameterTypes();

        // 获取参数注解

        final Annotation[][] paramAnnotations = method.getParameterAnnotations();

        final SortedMap<Integer, String> map = new TreeMap<Integer, String>();

        int paramCount = paramAnnotations.length;

        for (int paramIndex = 0; paramIndex < paramCount; paramIndex++) {

            // 检测当前的参数类型是否为 RowBounds 或 ResultHandler

            if (isSpecialParameter(paramTypes[paramIndex])) {

                continue;

            }

            String name = null;

            for (Annotation annotation : paramAnnotations[paramIndex]) {

                if (annotation instanceof Param) {

                    hasParamAnnotation = true;

                    // 获取 @Param 注解内容

                    name = ((Param) annotation).value();

                    break;

                }

            }

            // name 为空，表明未给参数配置 @Param 注解

            if (name == null) {

                // 检测是否设置了 useActualParamName 全局配置

                if (config.isUseActualParamName()) {

                    /*

                     * 通过反射获取参数名称。此种方式要求 JDK 版本为 1.8+，

                     * 且要求编译时加入 -parameters 参数，否则获取到的参数名

                     * 仍然是 arg1, arg2, ..., argN

                     */

                    name = getActualParamName(method, paramIndex);

                }

                if (name == null) {

                    /*

                     * 使用 map.size() 返回值作为名称，思考一下为什么不这样写：

                     *   name = String.valueOf(paramIndex);

                     * 因为如果参数列表中包含 RowBounds 或 ResultHandler，这两个参数

                     * 会被忽略掉，这样将导致名称不连续。

                     *

                     * 比如参数列表 (int p1, int p2, RowBounds rb, int p3)

                     *  - 期望得到名称列表为 ["0", "1", "2"]

                     *  - 实际得到名称列表为 ["0", "1", "3"]

                     */

                    name = String.valueOf(map.size());

                }

            }

            // 存储 paramIndex 到 name 的映射

            map.put(paramIndex, name);

        }

        names = Collections.unmodifiableSortedMap(map);

    }

}

以上就是方法参数列表的解析过程，解析完毕后，可得到参数下标到参数名的映射关系，这些映射关系最终存储在 ParamNameResolver 的 names 成员变量中。这些映射关系将会在后面的代码中被用到，大家留意一下。

下面写点代码测试一下 ParamNameResolver 的解析逻辑。如下：

public class ParamNameResolverTest {

    @Test

    public void test() throws NoSuchMethodException, NoSuchFieldException, IllegalAccessException {

        Configuration config = new Configuration();

        config.setUseActualParamName(false);

        Method method = ArticleMapper.class.getMethod("select", Integer.class, String.class, RowBounds.class, Article.class);

        ParamNameResolver resolver = new ParamNameResolver(config, method);

        Field field = resolver.getClass().getDeclaredField("names");

        field.setAccessible(true);

        // 通过反射获取 ParamNameResolver 私有成员变量 names

        Object names = field.get(resolver);

        System.out.println("names: " + names);

    }

    class ArticleMapper {

        public void select(@Param("id") Integer id, @Param("author") String author, RowBounds rb, Article article) {}

    }

}

测试结果如下：

MyBatis 源码分析 - SQL 的执行过程

参数索引与名称映射图如下：

MyBatis 源码分析 - SQL 的执行过程

到此，关于 MapperMethod 的初始化逻辑就分析完了，继续往下分析。

2.1.2.2 执行 execute 方法

前面已经分析了 MapperMethod 的初始化过程，现在 MapperMethod 创建好了。那么，接下来要做的事情是调用 MapperMethod 的 execute 方法，执行 SQL。代码如下：

// -☆- MapperMethod

public Object execute(SqlSession sqlSession, Object[] args) {

    Object result;

    // 根据 SQL 类型执行相应的数据库操作

    switch (command.getType()) {

        case INSERT: {

            // 对用户传入的参数进行转换，下同

            Object param = method.convertArgsToSqlCommandParam(args);

            // 执行插入操作，rowCountResult 方法用于处理返回值

            result = rowCountResult(sqlSession.insert(command.getName(), param));

            break;

        }

        case UPDATE: {

            Object param = method.convertArgsToSqlCommandParam(args);

            // 执行更新操作

            result = rowCountResult(sqlSession.update(command.getName(), param));

            break;

        }

        case DELETE: {

            Object param = method.convertArgsToSqlCommandParam(args);

            // 执行删除操作

            result = rowCountResult(sqlSession.delete(command.getName(), param));

            break;

        }

        case SELECT:

            // 根据目标方法的返回类型进行相应的查询操作

            if (method.returnsVoid() && method.hasResultHandler()) {

                /*

                 * 如果方法返回值为 void，但参数列表中包含 ResultHandler，表明使用者

                 * 想通过 ResultHandler 的方式获取查询结果，而非通过返回值获取结果

                 */

                executeWithResultHandler(sqlSession, args);

                result = null;

            } else if (method.returnsMany()) {

                // 执行查询操作，并返回多个结果

                result = executeForMany(sqlSession, args);

            } else if (method.returnsMap()) {

                // 执行查询操作，并将结果封装在 Map 中返回

                result = executeForMap(sqlSession, args);

            } else if (method.returnsCursor()) {

                // 执行查询操作，并返回一个 Cursor 对象

                result = executeForCursor(sqlSession, args);

            } else {

                Object param = method.convertArgsToSqlCommandParam(args);

                // 执行查询操作，并返回一个结果

                result = sqlSession.selectOne(command.getName(), param);

            }

            break;

        case FLUSH:

            // 执行刷新操作

            result = sqlSession.flushStatements();

            break;

        default:

            throw new BindingException("Unknown execution method for: " + command.getName());

    }

    // 如果方法的返回值为基本类型，而返回值却为 null，此种情况下应抛出异常

    if (result == null && method.getReturnType().isPrimitive() && !method.returnsVoid()) {

        throw new BindingException("Mapper method '" + command.getName()

            + " attempted to return null from a method with a primitive return type (" + method.getReturnType()

            + ").");

    }

    return result;

}

如上，execute 方法主要由一个 switch 语句组成，用于根据 SQL 类型执行相应的数据库操作。该方法的逻辑清晰，不需要太多的分析。不过在上面的方法中 convertArgsToSqlCommandParam 方法出现次数比较频繁，这里分析一下：

// -☆- MapperMethod

public Object convertArgsToSqlCommandParam(Object[] args) {

    return paramNameResolver.getNamedParams(args);

}

public Object getNamedParams(Object[] args) {

    final int paramCount = names.size();

    if (args == null || paramCount == 0) {

        return null;

    } else if (!hasParamAnnotation && paramCount == 1) {

        /*

         * 如果方法参数列表无 @Param 注解，且仅有一个非特别参数，则返回该参数的值。

         * 比如如下方法：

         *     List findList(RowBounds rb, String name)

         * names 如下：

         *     names = {1 : "0"}

         * 此种情况下，返回 args[names.firstKey()]，即 args[1] -> name

         */

        return args[names.firstKey()];

    } else {

        final Map<String, Object> param = new ParamMap<Object>();

        int i = 0;

        for (Map.Entry<Integer, String> entry : names.entrySet()) {

            // 添加 <参数名, 参数值> 键值对到 param 中

            param.put(entry.getValue(), args[entry.getKey()]);

            // genericParamName = param + index。比如 param1, param2, ... paramN

            final String genericParamName = GENERIC_NAME_PREFIX + String.valueOf(i + 1);

            /*

             * 检测 names 中是否包含 genericParamName，什么情况下会包含？答案如下：

             *

             *   使用者显式将参数名称配置为 param1，即 @Param("param1")

             */

            if (!names.containsValue(genericParamName)) {

                // 添加 <param*, value> 到 param 中

                param.put(genericParamName, args[entry.getKey()]);

            }

            i++;

        }

        return param;

    }

}

如上，convertArgsToSqlCommandParam 是一个空壳方法，该方法最终调用了 ParamNameResolver 的 getNamedParams 方法。getNamedParams 方法的主要逻辑是根据条件返回不同的结果，该方法的代码不是很难理解，我也进行了比较详细的注释，就不多说了。

分析完 convertArgsToSqlCommandParam 的逻辑，接下来说说 MyBatis 对哪些 SQL 指令提供了支持，如下：

查询语句：SELECT
更新语句：INSERT/UPDATE/DELETE
存储过程：CALL

在上面的列表中，我刻意对 SELECT/INSERT/UPDATE/DELETE 等指令进行了分类，分类依据指令的功能以及 MyBatis 执行这些指令的过程。这里把 SELECT 称为查询语句，INSERT/UPDATE/DELETE 等称为更新语句。接下来，先来分析查询语句的执行过程。

2.2 查询语句的执行过程分析

查询语句对应的方法比较多，有如下几种：

executeWithResultHandler
executeForMany
executeForMap
executeForCursor

这些方法在内部调用了 SqlSession 中的一些 select* 方法，比如 selectList、selectMap、selectCursor 等。这些方法的返回值类型是不同的，因此对于每种返回类型，需要有专门的处理方法。以 selectList 方法为例，该方法的返回值类型为 List。但如果我们的 Mapper 或 Dao 的接口方法返回值类型为数组，或者 Set，直接将 List 类型的结果返回给 Mapper/Dao 就不合适了。execute* 等方法只是对 select* 等方法做了一层简单的封装，因此接下来我们应该把目光放在这些 select* 方法上。下面我们来分析一下 selectOne 方法的源码，如下：

2.2.1 selectOne 方法分析

本节选择分析 selectOne 方法，而不是其他的方法，大家或许会觉得奇怪。前面提及了 selectList、selectMap、selectCursor 等方法，这里却分析一个未提及的方法。这样做并没什么特别之处，主要原因是 selectOne 在内部会调用 selectList 方法。这里分析 selectOne 方法是为了告知大家，selectOne 和 selectList 方法是有联系的，同时分析 selectOne 方法等同于分析 selectList 方法。如果你不信的话，那我们看源码吧，源码面前了无秘密。

// -☆- DefaultSqlSession

public <T> T selectOne(String statement, Object parameter) {

    // 调用 selectList 获取结果

    List<T> list = this.<T>selectList(statement, parameter);

    if (list.size() == 1) {

        // 返回结果

        return list.get(0);

    } else if (list.size() > 1) {

        // 如果查询结果大于1则抛出异常，这个异常也是很常见的

        throw new TooManyResultsException(

            "Expected one result (or null) to be returned by selectOne(), but found: " + list.size());

    } else {

        return null;

    }

}

如上，selectOne 方法在内部调用 selectList 了方法，并取 selectList 返回值的第1个元素作为自己的返回值。如果 selectList 返回的列表元素大于1，则抛出异常。上面代码比较易懂，就不多说了。下面我们来看看 selectList 方法的实现。

// -☆- DefaultSqlSession

public <E> List<E> selectList(String statement, Object parameter) {

    // 调用重载方法

    return this.selectList(statement, parameter, RowBounds.DEFAULT);

}

private final Executor executor;

public <E> List<E> selectList(String statement, Object parameter, RowBounds rowBounds) {

    try {

        // 获取 MappedStatement

        MappedStatement ms = configuration.getMappedStatement(statement);

        // 调用 Executor 实现类中的 query 方法

        return executor.query(ms, wrapCollection(parameter), rowBounds, Executor.NO_RESULT_HANDLER);

    } catch (Exception e) {

        throw ExceptionFactory.wrapException("Error querying database.  Cause: " + e, e);

    } finally {

        ErrorContext.instance().reset();

    }

}

如上，这里要来说说 executor 变量，该变量类型为 Executor。Executor 是一个接口，它的实现类如下：

MyBatis 源码分析 - SQL 的执行过程

如上，Executor 有这么多的实现类，大家猜一下 executor 变量对应哪个实现类。要弄清楚这个问题，需要大家到源头去查证。这里提示一下，大家可以跟踪一下 DefaultSqlSessionFactory 的 openSession 方法，很快就能发现executor 变量创建的踪迹。限于篇幅原因，本文就不分析 openSession 方法的源码了。好了，下面我来直接告诉大家 executor 变量对应哪个实现类吧。默认情况下，executor 的类型为 CachingExecutor，该类是一个装饰器类，用于给目标 Executor 增加二级缓存功能。那目标 Executor 是谁呢？默认情况下是 SimpleExecutor。

现在大家搞清楚 executor 变量的身份了，接下来继续分析 selectOne 方法的调用栈。先来看看 CachingExecutor 的 query 方法是怎样实现的。如下：

// -☆- CachingExecutor

public <E> List<E> query(MappedStatement ms, Object parameterObject, RowBounds rowBounds, ResultHandler resultHandler) throws SQLException {

    // 获取 BoundSql

    BoundSql boundSql = ms.getBoundSql(parameterObject);

    // 创建 CacheKey

    CacheKey key = createCacheKey(ms, parameterObject, rowBounds, boundSql);

    // 调用重载方法

    return query(ms, parameterObject, rowBounds, resultHandler, key, boundSql);

}

上面的代码用于获取 BoundSql 对象，创建 CacheKey 对象，然后再将这两个对象传给重载方法。关于 BoundSql 的获取过程较为复杂，我将在下一节进行分析。CacheKey 以及接下来即将出现的一二级缓存将会独立成文进行分析。

上面的方法和 SimpleExecutor 父类 BaseExecutor 中的实现没什么区别，有区别的地方在于这个方法所调用的重载方法。我们继续往下看。

// -☆- CachingExecutor

public <E> List<E> query(MappedStatement ms, Object parameterObject, RowBounds rowBounds, ResultHandler resultHandler, CacheKey key, BoundSql boundSql) throws SQLException {

    // 从 MappedStatement 中获取缓存

    Cache cache = ms.getCache();

    // 若映射文件中未配置缓存或参照缓存，此时 cache = null

    if (cache != null) {

        flushCacheIfRequired(ms);

        if (ms.isUseCache() && resultHandler == null) {

            ensureNoOutParams(ms, boundSql);

            List<E> list = (List<E>) tcm.getObject(cache, key);

            if (list == null) {

                // 若缓存未命中，则调用被装饰类的 query 方法

                list = delegate.<E>query(ms, parameterObject, rowBounds, resultHandler, key, boundSql);

                tcm.putObject(cache, key, list); // issue #578 and #116

            }

            return list;

        }

    }

    // 调用被装饰类的 query 方法

    return delegate.<E>query(ms, parameterObject, rowBounds, resultHandler, key, boundSql);

}

上面的代码涉及到了二级缓存，若二级缓存为空，或未命中，则调用被装饰类的 query 方法。下面来看一下 BaseExecutor 的中签名相同的 query 方法是如何实现的。

// -☆- BaseExecutor

public <E> List<E> query(MappedStatement ms, Object parameter, RowBounds rowBounds, ResultHandler resultHandler, CacheKey key, BoundSql boundSql) throws SQLException {

    if (closed) {

        throw new ExecutorException("Executor was closed.");

    }

    if (queryStack == 0 && ms.isFlushCacheRequired()) {

        clearLocalCache();

    }

    List<E> list;

    try {

        queryStack++;

        // 从一级缓存中获取缓存项

        list = resultHandler == null ? (List<E>) localCache.getObject(key) : null;

        if (list != null) {

            // 存储过程相关处理逻辑，本文不分析存储过程，故该方法不分析了

            handleLocallyCachedOutputParameters(ms, key, parameter, boundSql);

        } else {

            // 一级缓存未命中，则从数据库中查询

            list = queryFromDatabase(ms, parameter, rowBounds, resultHandler, key, boundSql);

        }

    } finally {

        queryStack--;

    }

    if (queryStack == 0) {

        // 从一级缓存中延迟加载嵌套查询结果

        for (DeferredLoad deferredLoad : deferredLoads) {

            deferredLoad.load();

        }

        deferredLoads.clear();

        if (configuration.getLocalCacheScope() == LocalCacheScope.STATEMENT) {

            clearLocalCache();

        }

    }

    return list;

}

如上，上面的方法主要用于从一级缓存中查找查询结果。若缓存未命中，再向数据库进行查询。在上面的代码中，出现了一个新的类 DeferredLoad，这个类用于延迟加载。该类的实现并不复杂，但是具体用途让我有点疑惑。这个我目前也未完全搞清楚，就不强行分析了。接下来，我们来看一下 queryFromDatabase 方法的实现。

// -☆- BaseExecutor

private <E> List<E> queryFromDatabase(MappedStatement ms, Object parameter, RowBounds rowBounds,

    ResultHandler resultHandler, CacheKey key, BoundSql boundSql) throws SQLException {

    List<E> list;

    // 向缓存中存储一个占位符

    localCache.putObject(key, EXECUTION_PLACEHOLDER);

    try {

        // 调用 doQuery 进行查询

        list = doQuery(ms, parameter, rowBounds, resultHandler, boundSql);

    } finally {

        // 移除占位符

        localCache.removeObject(key);

    }

    // 缓存查询结果

    localCache.putObject(key, list);

    if (ms.getStatementType() == StatementType.CALLABLE) {

        localOutputParameterCache.putObject(key, parameter);

    }

    return list;

}

上面的代码仍然不是 selectOne 方法调用栈的终点，抛开缓存操作，queryFromDatabase 最终还会调用 doQuery 进行查询。下面我们继续进行跟踪。

// -☆- SimpleExecutor

public <E> List<E> doQuery(MappedStatement ms, Object parameter, RowBounds rowBounds, ResultHandler resultHandler, BoundSql boundSql) throws SQLException {

    Statement stmt = null;

    try {

        Configuration configuration = ms.getConfiguration();

        // 创建 StatementHandler

        StatementHandler handler = configuration.newStatementHandler(wrapper, ms, parameter, rowBounds, resultHandler, boundSql);

        // 创建 Statement

        stmt = prepareStatement(handler, ms.getStatementLog());

        // 执行查询操作

        return handler.<E>query(stmt, resultHandler);

    } finally {

        // 关闭 Statement

        closeStatement(stmt);

    }

}

上面的方法中仍然有不少的逻辑，完全看不到即将要到达终点的趋势，不过这离终点又近了一步。接下来，我们先跳过 StatementHandler 和 Statement 创建过程，这两个对象的创建过程会在后面进行说明。这里，我们以 PreparedStatementHandler 为例，看看它的 query 方法是怎样实现的。如下：

// -☆- PreparedStatementHandler

public <E> List<E> query(Statement statement, ResultHandler resultHandler) throws SQLException {

    PreparedStatement ps = (PreparedStatement) statement;

    // 执行 SQL

    ps.execute();

    // 处理执行结果

    return resultSetHandler.<E>handleResultSets(ps);

}

到这里似乎看到了希望，整个调用过程总算要结束了。不过先别高兴的太早，SQL 执行结果的处理过程也很复杂，稍后将会专门拿出一节内容进行分析。

以上就是 selectOne 方法的执行过程，尽管我已经简化了代码分析，但是整个过程看起来还是很复杂的。查询过程涉及到了很多方法调用，不把这些调用方法搞清楚，很难对 MyBatis 的查询过程有深入的理解。所以在接下来的章节中，我将会对一些重要的调用进行分析。如果大家不满足于泛泛而谈，那么接下来咱们一起进行更为深入的探索吧。

2.2.2 获取 BoundSql

我们在执行 SQL 时，一个重要的任务是将 SQL 语句解析出来。我们都知道 SQL 是配置在映射文件中的，但由于映射文件中的 SQL 可能会包含占位符 #{}，以及动态 SQL 标签，比如 <if>、<where> 等。因此，我们并不能直接使用映射文件中配置的 SQL。MyBatis 会将映射文件中的 SQL 解析成一组 SQL 片段。如果某个片段中也包含动态 SQL 相关的标签，那么，MyBatis 会对该片段再次进行分片。最终，一个 SQL 配置将会被解析成一个 SQL 片段树。形如下面的图片：

MyBatis 源码分析 - SQL 的执行过程

我们需要对片段树进行解析，以便从每个片段对象中获取相应的内容。然后将这些内容组合起来即可得到一个完成的 SQL 语句，这个完整的 SQL 以及其他的一些信息最终会存储在 BoundSql 对象中。下面我们来看一下 BoundSql 类的成员变量信息，如下：

private final String sql;

private final List<ParameterMapping> parameterMappings;

private final Object parameterObject;

private final Map<String, Object> additionalParameters;

private final MetaObject metaParameters;

下面用一个表格列举各个成员变量的含义。

变量名	类型	用途
sql	String	一个完整的 SQL 语句，可能会包含问号 ? 占位符
parameterMappings	List	参数映射列表，SQL 中的每个 #{xxx} 占位符都会被解析成相应的 ParameterMapping 对象
parameterObject	Object	运行时参数，即用户传入的参数，比如 Article 对象，或是其他的参数
additionalParameters	Map	附加参数集合，用于存储一些额外的信息，比如 datebaseId 等
metaParameters	MetaObject	additionalParameters 的元信息对象

以上对 BoundSql 的成员变量做了简要的说明，部分参数的用途大家现在可能不是很明白。不过不用着急，这些变量在接下来的源码分析过程中会陆续的出现。到时候对着源码多思考，或是写点测试代码调试一下，即可弄懂。

好了，现在准备工作已经做好。接下来，开始分析 BoundSql 的构建过程。我们源码之旅的第一站是 MappedStatement 的 getBoundSql 方法，代码如下：

// -☆- MappedStatement

public BoundSql getBoundSql(Object parameterObject) {

    // 调用 sqlSource 的 getBoundSql 获取 BoundSql

    BoundSql boundSql = sqlSource.getBoundSql(parameterObject);

    List<ParameterMapping> parameterMappings = boundSql.getParameterMappings();

    if (parameterMappings == null || parameterMappings.isEmpty()) {

        /*

         * 创建新的 BoundSql，这里的 parameterMap 是 ParameterMap 类型。

         * 由<ParameterMap> 节点进行配置，该节点已经废弃，不推荐使用。默认情况下，

         * parameterMap.getParameterMappings() 返回空集合

         */

        boundSql = new BoundSql(configuration, boundSql.getSql(), parameterMap.getParameterMappings(), parameterObject);

    }

    // 省略不重要的逻辑

    return boundSql;

}

如上，MappedStatement 的 getBoundSql 在内部调用了 SqlSource 实现类的 getBoundSql 方法。处理此处的调用，余下的逻辑都不是重要逻辑，就不啰嗦了。接下来，我们把目光转移到 SqlSource 实现类的 getBoundSql 方法上。SqlSource 是一个接口，它有如下几个实现类：

DynamicSqlSource
RawSqlSource
StaticSqlSource
ProviderSqlSource
VelocitySqlSource

在如上几个实现类中，我们应该选择分析哪个实现类的逻辑呢？如果大家分析过 MyBatis 映射文件的解析过程，或者阅读过我上一篇的关于MyBatis 映射文件分析的文章，那么这个问题不难回答。好了，不卖关子了，我来回答一下这个问题吧。首先我们把最后两个排除掉，不常用。剩下的三个实现类中，仅前两个实现类会在映射文件解析的过程中被使用。当 SQL 配置中包含 ${}（不是 #{}）占位符，或者包含 <if>、<where> 等标签时，会被认为是动态 SQL，此时使用 DynamicSqlSource 存储 SQL 片段。否则，使用 RawSqlSource 存储 SQL 配置信息。相比之下 DynamicSqlSource 存储的 SQL 片段类型较多，解析起来也更为复杂一些。因此下面我将分析 DynamicSqlSource 的 getBoundSql 方法。弄懂这个，RawSqlSource 也不在话下。好了，下面开始分析。

// -☆- DynamicSqlSource

public BoundSql getBoundSql(Object parameterObject) {

    // 创建 DynamicContext

    DynamicContext context = new DynamicContext(configuration, parameterObject);

    // 解析 SQL 片段，并将解析结果存储到 DynamicContext 中

    rootSqlNode.apply(context);

    SqlSourceBuilder sqlSourceParser = new SqlSourceBuilder(configuration);

    Class<?> parameterType = parameterObject == null ? Object.class : parameterObject.getClass();

    /*

     * 构建 StaticSqlSource，在此过程中将 sql 语句中的占位符 #{} 替换为问号 ?，

     * 并为每个占位符构建相应的 ParameterMapping

     */

    SqlSource sqlSource = sqlSourceParser.parse(context.getSql(), parameterType, context.getBindings());

    // 调用 StaticSqlSource 的 getBoundSql 获取 BoundSql

    BoundSql boundSql = sqlSource.getBoundSql(parameterObject);

    // 将 DynamicContext 的 ContextMap 中的内容拷贝到 BoundSql 中

    for (Map.Entry<String, Object> entry : context.getBindings().entrySet()) {

        boundSql.setAdditionalParameter(entry.getKey(), entry.getValue());

    }

    return boundSql;

}

如上，DynamicSqlSource 的 getBoundSql 方法的代码看起来不多，但是逻辑却并不简单。该方法由数个步骤组成，这里总结一下：

创建 DynamicContext
解析 SQL 片段，并将解析结果存储到 DynamicContext 中
解析 SQL 语句，并构建 StaticSqlSource
调用 StaticSqlSource 的 getBoundSql 获取 BoundSql
将 DynamicContext 的 ContextMap 中的内容拷贝到 BoundSql 中

如上5个步骤中，第5步为常规操作，就不多说了，其他步骤将会在接下来章节中一一进行分析。按照顺序，我们先来分析 DynamicContext 的实现。

2.2.2.1 DynamicContext

DynamicContext 是 SQL 语句构建的上下文，每个 SQL 片段解析完成后，都会将解析结果存入 DynamicContext 中。待所有的 SQL 片段解析完毕后，一条完整的 SQL 语句就会出现在 DynamicContext 对象中。下面我们来看一下 DynamicContext 类的定义。

public class DynamicContext {

    public static final String PARAMETER_OBJECT_KEY = "_parameter";

    public static final String DATABASE_ID_KEY = "_databaseId";

    private final ContextMap bindings;

    private final StringBuilder sqlBuilder = new StringBuilder();

    public DynamicContext(Configuration configuration, Object parameterObject) {

        // 创建 ContextMap

        if (parameterObject != null && !(parameterObject instanceof Map)) {

            MetaObject metaObject = configuration.newMetaObject(parameterObject);

            bindings = new ContextMap(metaObject);

        } else {

            bindings = new ContextMap(null);

        }

        // 存放运行时参数 parameterObject 以及 databaseId

        bindings.put(PARAMETER_OBJECT_KEY, parameterObject);

        bindings.put(DATABASE_ID_KEY, configuration.getDatabaseId());

    }

    // 省略部分代码

}

如上，上面只贴了 DynamicContext 类的部分代码。其中 sqlBuilder 变量用于存放 SQL 片段的解析结果，bindings 则用于存储一些额外的信息，比如运行时参数和 databaseId 等。bindings 类型为 ContextMap，ContextMap 定义在 DynamicContext 中，是一个静态内部类。该类继承自 HashMap，并覆写了 get 方法。它的代码如下：

static class ContextMap extends HashMap<String, Object> {

    private MetaObject parameterMetaObject;

    public ContextMap(MetaObject parameterMetaObject) {

        this.parameterMetaObject = parameterMetaObject;

    }

    @Override

    public Object get(Object key) {

        String strKey = (String) key;

        // 检查是否包含 strKey，若包含则直接返回

        if (super.containsKey(strKey)) {

            return super.get(strKey);

        }

        if (parameterMetaObject != null) {

            // 从运行时参数中查找结果

            return parameterMetaObject.getValue(strKey);

        }

        return null;

    }

}

DynamicContext 对外提供了两个接口，用于操作 sqlBuilder。分别如下：

public void appendSql(String sql) {

    sqlBuilder.append(sql);

    sqlBuilder.append(" ");

}

public String getSql() {

    return sqlBuilder.toString().trim();

}

以上就是对 DynamicContext 的简单介绍，DynamicContext 的源码不难理解，这里就不多说了。继续往下分析。

2.2.2.2 解析 SQL 片段

对于一个包含了 ${} 占位符，或 <if>、<where> 等标签的 SQL，在解析的过程中，会被分解成多个片段。每个片段都有对应的类型，每种类型的片段都有不同的解析逻辑。在源码中，片段这个概念等价于 sql 节点，即 SqlNode。SqlNode 是一个接口，它有众多的实现类。其继承体系如下：

MyBatis 源码分析 - SQL 的执行过程

上图只画出了部分的实现类，还有一小部分没画出来，不过这并不影响接下来的分析。在众多实现类中，StaticTextSqlNode 用于存储静态文本，TextSqlNode 用于存储带有 ${} 占位符的文本，IfSqlNode 则用于存储 <if> 节点的内容。MixedSqlNode 内部维护了一个 SqlNode 集合，用于存储各种各样的 SqlNode。接下来，我将会对 MixedSqlNode 、StaticTextSqlNode、TextSqlNode、IfSqlNode、WhereSqlNode 以及 TrimSqlNode 等进行分析，其他的实现类请大家自行分析。Talk is cheap，show you the code.

public class MixedSqlNode implements SqlNode {

    private final List<SqlNode> contents;

    public MixedSqlNode(List<SqlNode> contents) {

        this.contents = contents;

    }

    @Override

    public boolean apply(DynamicContext context) {

        // 遍历 SqlNode 集合

        for (SqlNode sqlNode : contents) {

            // 调用 salNode 对象本身的 apply 方法解析 sql

            sqlNode.apply(context);

        }

        return true;

    }

}

MixedSqlNode 可以看做是 SqlNode 实现类对象的容器，凡是实现了 SqlNode 接口的类都可以存储到 MixedSqlNode 中，包括它自己。MixedSqlNode 解析方法 apply 逻辑比较简单，即遍历 SqlNode 集合，并调用其他 SalNode 实现类对象的 apply 方法解析 sql。那下面我们来看看其他 SalNode 实现类的 apply 方法是怎样实现的。

public class StaticTextSqlNode implements SqlNode {

    private final String text;

    public StaticTextSqlNode(String text) {

        this.text = text;

    }

    @Override

    public boolean apply(DynamicContext context) {

        context.appendSql(text);

        return true;

    }

}

StaticTextSqlNode 用于存储静态文本，所以它不需要什么解析逻辑，直接将其存储的 SQL 片段添加到 DynamicContext 中即可。StaticTextSqlNode 的实现比较简单，看起来很轻松。下面分析一下 TextSqlNode。

public class TextSqlNode implements SqlNode {

    private final String text;

    private final Pattern injectionFilter;

    @Override

    public boolean apply(DynamicContext context) {

        // 创建 ${} 占位符解析器

        GenericTokenParser parser = createParser(new BindingTokenParser(context, injectionFilter));

        // 解析 ${} 占位符，并将解析结果添加到 DynamicContext 中

        context.appendSql(parser.parse(text));

        return true;

    }

    private GenericTokenParser createParser(TokenHandler handler) {

        // 创建占位符解析器，GenericTokenParser 是一个通用解析器，并非只能解析 ${}

        return new GenericTokenParser("${", "}", handler);

    }

    private static class BindingTokenParser implements TokenHandler {

        private DynamicContext context;

        private Pattern injectionFilter;

        public BindingTokenParser(DynamicContext context, Pattern injectionFilter) {

            this.context = context;

            this.injectionFilter = injectionFilter;

        }

        @Override

        public String handleToken(String content) {

            Object parameter = context.getBindings().get("_parameter");

            if (parameter == null) {

                context.getBindings().put("value", null);

            } else if (SimpleTypeRegistry.isSimpleType(parameter.getClass())) {

                context.getBindings().put("value", parameter);

            }

            // 通过 ONGL 从用户传入的参数中获取结果

            Object value = OgnlCache.getValue(content, context.getBindings());

            String srtValue = (value == null ? "" : String.valueOf(value));

            // 通过正则表达式检测 srtValue 有效性

            checkInjection(srtValue);

            return srtValue;

        }

    }

}

如上，GenericTokenParser 是一个通用的标记解析器，用于解析形如 ${xxx}，#{xxx} 等标记。GenericTokenParser 负责将标记中的内容抽取出来，并将标记内容交给相应的 TokenHandler 去处理。BindingTokenParser 负责解析标记内容，并将解析结果返回给 GenericTokenParser，用于替换 ${xxx} 标记。举个例子说明一下吧，如下。

我们有这样一个 SQL 语句，用于从 article 表中查询某个作者所写的文章。如下：

SELECT * FROM article WHERE author = '${author}'

假设我们我们传入的 author 值为 tianxiaobo，那么该 SQL 最终会被解析成如下的结果：

SELECT * FROM article WHERE author = 'tianxiaobo'

一般情况下，使用 ${author} 接受参数都没什么问题。但是怕就怕在有人不怀好意，构建了一些恶意的参数。当用这些恶意的参数替换 ${author} 时就会出现灾难性问题 -- SQL 注入。比如我们构建这样一个参数 author = tianxiaobo'; DELETE FROM article;# ，然后我们把这个参数传给 TextSqlNode 进行解析。得到的结果如下：

SELECT * FROM article WHERE author = 'tianxiaobo'; DELETE FROM article;#'

看到没，由于传入的参数没有经过转义，最终导致了一条 SQL 被恶意参数拼接成了两条 SQL。更要命的是，第二天 SQL 会把 article 表的数据清空，这个后果就很严重了（从删库到跑路）。这就是为什么我们不应该在 SQL 语句中是用 ${} 占位符，风险太大。

分析完 TextSqlNode 的逻辑，接下来，分析 IfSqlNode 的实现。

public class IfSqlNode implements SqlNode {

    private final ExpressionEvaluator evaluator;

    private final String test;

    private final SqlNode contents;

    public IfSqlNode(SqlNode contents, String test) {

        this.test = test;

        this.contents = contents;

        this.evaluator = new ExpressionEvaluator();

    }

    @Override

    public boolean apply(DynamicContext context) {

        // 通过 ONGL 评估 test 表达式的结果

        if (evaluator.evaluateBoolean(test, context.getBindings())) {

            // 若 test 表达式中的条件成立，则调用其他节点的 apply 方法进行解析

            contents.apply(context);

            return true;

        }

        return false;

    }

}

IfSqlNode 对应的是 <if test='xxx'> 节点，<if> 节点是日常开发中使用频次比较高的一个节点。它的具体用法我想大家都很熟悉了，这里就不多啰嗦。IfSqlNode 的 apply 方法逻辑并不复杂，首先是通过 ONGL 检测 test 表达式是否为 true，如果为 true，则调用其他节点的 apply 方法继续进行解析。需要注意的是 <if> 节点中也可嵌套其他的动态节点，并非只有纯文本。因此 contents 变量遍历指向的是 MixedSqlNode，而非 StaticTextSqlNode。

关于 IfSqlNode 就说到这，接下来分析 WhereSqlNode 的实现。

public class WhereSqlNode extends TrimSqlNode {

    /** 前缀列表 */

    private static List<String> prefixList = Arrays.asList("AND ", "OR ", "AND\n", "OR\n", "AND\r", "OR\r", "AND\t", "OR\t");

    public WhereSqlNode(Configuration configuration, SqlNode contents) {

        // 调用父类的构造方法

        super(configuration, contents, "WHERE", prefixList, null, null);

    }

}

在 MyBatis 中，WhereSqlNode 和 SetSqlNode 都是基于 TrimSqlNode 实现的，所以上面的代码看起来很简单。WhereSqlNode 对应于 <where> 节点，关于该节点的用法以及它的应用场景，大家请自行查阅资料。我在分析源码的过程中，默认大家已经知道了该节点的用途和应用场景。

接下来，我们把目光聚焦在 TrimSqlNode 的实现上。

public class TrimSqlNode implements SqlNode {

    private final SqlNode contents;

    private final String prefix;

    private final String suffix;

    private final List<String> prefixesToOverride;

    private final List<String> suffixesToOverride;

    private final Configuration configuration;

   // 省略构造方法

    @Override

    public boolean apply(DynamicContext context) {

        // 创建具有过滤功能的 DynamicContext

        FilteredDynamicContext filteredDynamicContext = new FilteredDynamicContext(context);

        // 解析节点内容

        boolean result = contents.apply(filteredDynamicContext);

        // 过滤掉前缀和后缀

        filteredDynamicContext.applyAll();

        return result;

    }

}

如上，apply 方法首选调用了其他 SqlNode 的 apply 方法解析节点内容，这步操作完成后，FilteredDynamicContext 中会得到一条 SQL 片段字符串。接下里需要做的事情是过滤字符串前缀后和后缀，并添加相应的前缀和后缀。这个事情由 FilteredDynamicContext 负责，FilteredDynamicContext 是 TrimSqlNode 的私有内部类。我们去看一下它的代码。

private class FilteredDynamicContext extends DynamicContext {

    private DynamicContext delegate;

    /** 构造方法会将下面两个布尔值置为 false */

    private boolean prefixApplied;

    private boolean suffixApplied;

    private StringBuilder sqlBuffer;

    // 省略构造方法

    public void applyAll() {

        sqlBuffer = new StringBuilder(sqlBuffer.toString().trim());

        String trimmedUppercaseSql = sqlBuffer.toString().toUpperCase(Locale.ENGLISH);

        if (trimmedUppercaseSql.length() > 0) {

            // 引用前缀和后缀，也就是对 sql 进行过滤操作，移除掉前缀或后缀

            applyPrefix(sqlBuffer, trimmedUppercaseSql);

            applySuffix(sqlBuffer, trimmedUppercaseSql);

        }

        // 将当前对象的 sqlBuffer 内容添加到代理类中

        delegate.appendSql(sqlBuffer.toString());

    }

    // 省略部分方法

    private void applyPrefix(StringBuilder sql, String trimmedUppercaseSql) {

        if (!prefixApplied) {

            // 设置 prefixApplied 为 true，以下逻辑仅会被执行一次

            prefixApplied = true;

            if (prefixesToOverride != null) {

                for (String toRemove : prefixesToOverride) {

                    // 检测当前 sql 字符串是否包含 toRemove 前缀，比如 'AND ', 'AND\t'

                    if (trimmedUppercaseSql.startsWith(toRemove)) {

                        // 移除前缀

                        sql.delete(0, toRemove.trim().length());

                        break;

                    }

                }

            }

            // 插入前缀，比如 WHERE

            if (prefix != null) {

                sql.insert(0, " ");

                sql.insert(0, prefix);

            }

        }

    }

    // 该方法逻辑与 applyPrefix 大同小异，大家自行分析

    private void applySuffix(StringBuilder sql, String trimmedUppercaseSql) {...}

}

在上面的代码中，我们重点关注 applyAll 和 applyPrefix 方法，其他的方法大家自行分析。applyAll 方法的逻辑比较简单，首先从 sqlBuffer 中获取 SQL 字符串。然后调用 applyPrefix 和 applySuffix 进行过滤操作。最后将过滤后的 SQL 字符串添加到被装饰的类中。applyPrefix 方法会首先检测 SQL 字符串是不是以 "AND "，"OR "，或 "AND\n"， "OR\n" 等前缀开头，若是则将前缀从 sqlBuffer 中移除。然后将前缀插入到 sqlBuffer 的首部，整个逻辑就结束了。下面写点代码简单验证一下，如下：

public class SqlNodeTest {

    @Test

    public void testWhereSqlNode() throws IOException {

        String sqlFragment = "AND id = #{id}";

        MixedSqlNode msn = new MixedSqlNode(Arrays.asList(new StaticTextSqlNode(sqlFragment)));

        WhereSqlNode wsn = new WhereSqlNode(new Configuration(), msn);

        DynamicContext dc = new DynamicContext(new Configuration(), new ParamMap<>());

        wsn.apply(dc);

        System.out.println("解析前：" + sqlFragment);

        System.out.println("解析后：" + dc.getSql());

    }

}

测试结果如下：

MyBatis 源码分析 - SQL 的执行过程

2.2.2.3 解析 #{} 占位符

经过前面的解析，我们已经能从 DynamicContext 获取到完整的 SQL 语句了。但这并不意味着解析过程就结束了，因为当前的 SQL 语句中还有一种占位符没有处理，即 #{}。与 ${} 占位符的处理方式不同，MyBatis 并不会直接将 #{} 占位符替换为相应的参数值。#{} 占位符的解析逻辑这里先不多说，等相应的源码分析完了，答案就明了了。

#{} 占位符的解析逻辑是包含在 SqlSourceBuilder 的 parse 方法中，该方法最终会将解析后的 SQL 以及其他的一些数据封装到 StaticSqlSource 中。下面，一起来看一下 SqlSourceBuilder 的 parse 方法。

// -☆- SqlSourceBuilder

public SqlSource parse(String originalSql, Class<?> parameterType, Map<String, Object> additionalParameters) {

    // 创建 #{} 占位符处理器

    ParameterMappingTokenHandler handler = new ParameterMappingTokenHandler(configuration, parameterType, additionalParameters);

    // 创建 #{} 占位符解析器

    GenericTokenParser parser = new GenericTokenParser("#{", "}", handler);

    // 解析 #{} 占位符，并返回解析结果

    String sql = parser.parse(originalSql);

    // 封装解析结果到 StaticSqlSource 中，并返回

    return new StaticSqlSource(configuration, sql, handler.getParameterMappings());

}

如上，GenericTokenParser 的用途上一节已经介绍过了，就不多说了。接下来，我们重点关注 #{} 占位符处理器 ParameterMappingTokenHandler 的逻辑。

public String handleToken(String content) {

    // 获取 content 的对应的 ParameterMapping

    parameterMappings.add(buildParameterMapping(content));

    // 返回 ?

    return "?";

}

ParameterMappingTokenHandler 的 handleToken 方法看起来比较简单，但实际上并非如此。GenericTokenParser 负责将 #{} 占位符中的内容抽取出来，并将抽取出的内容传给 handleToken 方法。handleToken 方法负责将传入的参数解析成对应的 ParameterMapping 对象，这步操作由 buildParameterMapping 方法完成。下面我们看一下 buildParameterMapping 的源码。

private ParameterMapping buildParameterMapping(String content) {

    /*

     * 将 #{xxx} 占位符中的内容解析成 Map。大家可能很好奇一个普通的字符串是怎么解析成 Map 的，

     * 举例说明一下。如下：

     *

     *    #{age,javaType=int,jdbcType=NUMERIC,typeHandler=MyTypeHandler}

     *

     * 上面占位符中的内容最终会被解析成如下的结果：

     *

     *  {

     *      "property": "age",

     *      "typeHandler": "MyTypeHandler",

     *      "jdbcType": "NUMERIC",

     *      "javaType": "int"

     *  }

     *

     * parseParameterMapping 内部依赖 ParameterExpression 对字符串进行解析，ParameterExpression 的

     * 逻辑不是很复杂，这里就不分析了。大家若有兴趣，可自行分析

     */

    Map<String, String> propertiesMap = parseParameterMapping(content);

    String property = propertiesMap.get("property");

    Class<?> propertyType;

    // metaParameters 为 DynamicContext 成员变量 bindings 的元信息对象

    if (metaParameters.hasGetter(property)) {

        propertyType = metaParameters.getGetterType(property);

    /*

     * parameterType 是运行时参数的类型。如果用户传入的是单个参数，比如 Article 对象，此时

     * parameterType 为 Article.class。如果用户传入的多个参数，比如 [id = 1, author = "coolblog"]，

     * MyBatis 会使用 ParamMap 封装这些参数，此时 parameterType 为 ParamMap.class。如果

     * parameterType 有相应的 TypeHandler，这里则把 parameterType 设为 propertyType

     */

    } else if (typeHandlerRegistry.hasTypeHandler(parameterType)) {

        propertyType = parameterType;

    } else if (JdbcType.CURSOR.name().equals(propertiesMap.get("jdbcType"))) {

        propertyType = java.sql.ResultSet.class;

    } else if (property == null || Map.class.isAssignableFrom(parameterType)) {

        // 如果 property 为空，或 parameterType 是 Map 类型，则将 propertyType 设为 Object.class

        propertyType = Object.class;

    } else {

        /*

         * 代码逻辑走到此分支中，表明 parameterType 是一个自定义的类，

         * 比如 Article，此时为该类创建一个元信息对象

         */

        MetaClass metaClass = MetaClass.forClass(parameterType, configuration.getReflectorFactory());

        // 检测参数对象有没有与 property 想对应的 getter 方法

        if (metaClass.hasGetter(property)) {

            // 获取成员变量的类型

            propertyType = metaClass.getGetterType(property);

        } else {

            propertyType = Object.class;

        }

    }

    // -------------------------- 分割线 ---------------------------

    ParameterMapping.Builder builder = new ParameterMapping.Builder(configuration, property, propertyType);

    // 将 propertyType 赋值给 javaType

    Class<?> javaType = propertyType;

    String typeHandlerAlias = null;

    // 遍历 propertiesMap

    for (Map.Entry<String, String> entry : propertiesMap.entrySet()) {

        String name = entry.getKey();

        String value = entry.getValue();

        if ("javaType".equals(name)) {

            // 如果用户明确配置了 javaType，则以用户的配置为准

            javaType = resolveClass(value);

            builder.javaType(javaType);

        } else if ("jdbcType".equals(name)) {

            // 解析 jdbcType

            builder.jdbcType(resolveJdbcType(value));

        } else if ("mode".equals(name)) {...}

        else if ("numericScale".equals(name)) {...}

        else if ("resultMap".equals(name)) {...}

        else if ("typeHandler".equals(name)) {

            typeHandlerAlias = value;

        }

        else if ("jdbcTypeName".equals(name)) {...}

        else if ("property".equals(name)) {...}

        else if ("expression".equals(name)) {

            throw new BuilderException("Expression based parameters are not supported yet");

        } else {

            throw new BuilderException("An invalid property '" + name + "' was found in mapping #{" + content

                + "}.  Valid properties are " + parameterProperties);

        }

    }

    if (typeHandlerAlias != null) {

        // 解析 TypeHandler

        builder.typeHandler(resolveTypeHandler(javaType, typeHandlerAlias));

    }

    // 构建 ParameterMapping 对象

    return builder.build();

}

如上，buildParameterMapping 代码很多，逻辑看起来很复杂。但是它做的事情却不是很多，只有3件事情。如下：

解析 content
解析 propertyType，对应分割线之上的代码
构建 ParameterMapping 对象，对应分割线之下的代码

buildParameterMapping 代码比较多，不太好理解，下面写个示例演示一下。如下：

public class SqlSourceBuilderTest {

    @Test

    public void test() {

        // 带有复杂 #{} 占位符的参数，接下里会解析这个占位符

        String sql = "SELECT * FROM Author WHERE age = #{age,javaType=int,jdbcType=NUMERIC}";

        SqlSourceBuilder sqlSourceBuilder = new SqlSourceBuilder(new Configuration());

        SqlSource sqlSource = sqlSourceBuilder.parse(sql, Author.class, new HashMap<>());

        BoundSql boundSql = sqlSource.getBoundSql(new Author());

        System.out.println(String.format("SQL: %s\n", boundSql.getSql()));

        System.out.println(String.format("ParameterMappings: %s", boundSql.getParameterMappings()));

    }

}

public class Author {

    private Integer id;

    private String name;

    private Integer age;

    // 省略 getter/setter

}

测试结果如下：

MyBatis 源码分析 - SQL 的执行过程

正如测试结果所示，SQL 中的 #{age, ...} 占位符被替换成了问号 ?。#{age, ...} 也被解析成了一个 ParameterMapping 对象。

本节的最后，我们再来看一下 StaticSqlSource 的创建过程。如下：

public class StaticSqlSource implements SqlSource {

    private final String sql;

    private final List<ParameterMapping> parameterMappings;

    private final Configuration configuration;

    public StaticSqlSource(Configuration configuration, String sql) {

        this(configuration, sql, null);

    }

    public StaticSqlSource(Configuration configuration, String sql, List<ParameterMapping> parameterMappings) {

        this.sql = sql;

        this.parameterMappings = parameterMappings;

        this.configuration = configuration;

    }

    @Override

    public BoundSql getBoundSql(Object parameterObject) {

        // 创建 BoundSql 对象

        return new BoundSql(configuration, sql, parameterMappings, parameterObject);

    }

}

上面代码没有什么太复杂的地方，从上面代码中可以看出 BoundSql 的创建过程也很简单。正因为前面经历了这么复杂的解析逻辑，BoundSql 的创建过程才会如此简单。到此，关于 BoundSql 构建的过程就分析完了，稍作休息，我们进行后面的分析。

2.2.3 创建 StatementHandler

在 MyBatis 的源码中，StatementHandler 是一个非常核心接口。之所以说它核心，是因为从代码分层的角度来说，StatementHandler 是 MyBatis 源码的边界，再往下层就是 JDBC 层面的接口了。StatementHandler 需要和 JDBC 层面的接口打交道，它要做的事情有很多。在执行 SQL 之前，StatementHandler 需要创建合适的 Statement 对象，然后填充参数值到 Statement 对象中，最后通过 Statement 对象执行 SQL。这还不算完，待 SQL 执行完毕，还要去处理查询结果等。这些过程看似简单，但实现起来却很复杂。好在，这些过程对应的逻辑并不需要我们亲自实现，只需要耐心看一下，难度降低了不少。好了，其他的就不多说了。下面我们来看一下 StatementHandler 的继承体系。

MyBatis 源码分析 - SQL 的执行过程

上图中，最下层的三种 StatementHandler 实现类与三种不同的 Statement 进行交互，这个不难看出来。但 RoutingStatementHandler 则是一个奇怪的存在，因为 JDBC 中并不存在 RoutingStatement。那它有什么用呢？接下来，我们到代码中寻找答案。

// -☆- Configuration

public StatementHandler newStatementHandler(Executor executor, MappedStatement mappedStatement,

    Object parameterObject, RowBounds rowBounds, ResultHandler resultHandler, BoundSql boundSql) {

    // 创建具有路由功能的 StatementHandler

    StatementHandler statementHandler = new RoutingStatementHandler(executor, mappedStatement, parameterObject, rowBounds, resultHandler, boundSql);

    // 应用插件到 StatementHandler 上

    statementHandler = (StatementHandler) interceptorChain.pluginAll(statementHandler);

    return statementHandler;

}

如上，newStatementHandler 方法在创建 StatementHandler 之后，还会应用插件到 StatementHandler 上。关于 MyBatis 的插件机制，后面独立成文进行讲解，这里就不分析了。下面分析一下 RoutingStatementHandler。

public class RoutingStatementHandler implements StatementHandler {

    private final StatementHandler delegate;

    public RoutingStatementHandler(Executor executor, MappedStatement ms, Object parameter, RowBounds rowBounds,

        ResultHandler resultHandler, BoundSql boundSql) {

        // 根据 StatementType 创建不同的 StatementHandler

        switch (ms.getStatementType()) {

            case STATEMENT:

                delegate = new SimpleStatementHandler(executor, ms, parameter, rowBounds, resultHandler, boundSql);

                break;

            case PREPARED:

                delegate = new PreparedStatementHandler(executor, ms, parameter, rowBounds, resultHandler, boundSql);

                break;

            case CALLABLE:

                delegate = new CallableStatementHandler(executor, ms, parameter, rowBounds, resultHandler, boundSql);

                break;

            default:

                throw new ExecutorException("Unknown statement type: " + ms.getStatementType());

        }

    }

    // 其他方法逻辑均由别的 StatementHandler 代理完成，就不贴代码了

}

如上，RoutingStatementHandler 的构造方法会根据 MappedStatement 中的 statementType 变量创建不同的 StatementHandler 实现类。默认情况下，statementType 值为 PREPARED。关于 StatementHandler 创建的过程就先分析到这，StatementHandler 创建完成了，后续要做到事情是创建 Statement，以及将运行时参数和 Statement 进行绑定。接下里，就来分析这一块的逻辑。

2.2.4 设置运行时参数到 SQL 中

JDBC 提供了三种 Statement 接口，分别是 Statement、PreparedStatement 和 CallableStatement。他们的关系如下：

MyBatis 源码分析 - SQL 的执行过程

上面三个接口的层级分明，其中 Statement 接口提供了执行 SQL，获取执行结果等基本功能。PreparedStatement 在此基础上，对 IN 类型的参数提供了支持。使得我们可以使用运行时参数替换 SQL 中的问号 ? 占位符，而不用手动拼接 SQL。CallableStatement 则是在 PreparedStatement 基础上，对 OUT 类型的参数提供了支持，该种类型的参数用于保存存储过程输出的结果。

本节，我将分析 PreparedStatement 的创建，以及设置运行时参数到 SQL 中的过程。其他两种 Statement 的处理过程，大家请自行分析。Statement 的创建入口是在 SimpleExecutor 的 prepareStatement 方法中，下面从这个方法开始进行分析。

// -☆- SimpleExecutor

private Statement prepareStatement(StatementHandler handler, Log statementLog) throws SQLException {

    Statement stmt;

    // 获取数据库连接

    Connection connection = getConnection(statementLog);

    // 创建 Statement，

    stmt = handler.prepare(connection, transaction.getTimeout());

    // 为 Statement 设置 IN 参数

    handler.parameterize(stmt);

    return stmt;

}

如上，上面代码的逻辑不复杂，总共包含三个步骤。如下：

获取数据库连接
创建 Statement
为 Statement 设置 IN 参数

上面三个步骤看起来并不难实现，实际上如果大家愿意写，也能写出来。不过 MyBatis 对着三个步骤进行拓展，实现上也相对复杂一下。以获取数据库连接为例，MyBatis 并未没有在 getConnection 方法中直接调用 JDBC DriverManager 的 getConnection 方法获取获取连接，而是通过数据源获取获取连接。MyBatis 提供了两种基于 JDBC 接口的数据源，分别为 PooledDataSource 和 UnpooledDataSource。创建或获取数据库连接的操作最终是由这两个数据源执行。限于篇幅问题，本节不打算分析以上两种数据源的源码，相关分析会在下一篇文章中展开。

接下来，我将分析 PreparedStatement 的创建，以及 IN 参数设置的过程。按照顺序，先来分析 PreparedStatement 的创建过程。如下：

// -☆- PreparedStatementHandler

public Statement prepare(Connection connection, Integer transactionTimeout) throws SQLException {

    Statement statement = null;

    try {

        // 创建 Statement

        statement = instantiateStatement(connection);

        // 设置超时和 FetchSize

        setStatementTimeout(statement, transactionTimeout);

        setFetchSize(statement);

        return statement;

    } catch (SQLException e) {

        closeStatement(statement);

        throw e;

    } catch (Exception e) {

        closeStatement(statement);

        throw new ExecutorException("Error preparing statement.  Cause: " + e, e);

    }

}

protected Statement instantiateStatement(Connection connection) throws SQLException {

    String sql = boundSql.getSql();

    // 根据条件调用不同的 prepareStatement 方法创建 PreparedStatement

    if (mappedStatement.getKeyGenerator() instanceof Jdbc3KeyGenerator) {

        String[] keyColumnNames = mappedStatement.getKeyColumns();

        if (keyColumnNames == null) {

            return connection.prepareStatement(sql, PreparedStatement.RETURN_GENERATED_KEYS);

        } else {

            return connection.prepareStatement(sql, keyColumnNames);

        }

    } else if (mappedStatement.getResultSetType() != null) {

        return connection.prepareStatement(sql, mappedStatement.getResultSetType().getValue(), ResultSet.CONCUR_READ_ONLY);

    } else {

        return connection.prepareStatement(sql);

    }

}

如上，PreparedStatement 的创建过程没什么复杂的地方，就不多说了。下面分析运行时参数是如何被设置到 SQL 中的过程。

// -☆- PreparedStatementHandler

public void parameterize(Statement statement) throws SQLException {

    // 通过参数处理器 ParameterHandler 设置运行时参数到 PreparedStatement 中

    parameterHandler.setParameters((PreparedStatement) statement);

}

public class DefaultParameterHandler implements ParameterHandler {

    private final TypeHandlerRegistry typeHandlerRegistry;

    private final MappedStatement mappedStatement;

    private final Object parameterObject;

    private final BoundSql boundSql;

    private final Configuration configuration;

    public void setParameters(PreparedStatement ps) {

        /*

         * 从 BoundSql 中获取 ParameterMapping 列表，每个 ParameterMapping

         * 与原始 SQL 中的 #{xxx} 占位符一一对应

         */

        List<ParameterMapping> parameterMappings = boundSql.getParameterMappings();

        if (parameterMappings != null) {

            for (int i = 0; i < parameterMappings.size(); i++) {

                ParameterMapping parameterMapping = parameterMappings.get(i);

                // 检测参数类型，排除掉 mode 为 OUT 类型的 parameterMapping

                if (parameterMapping.getMode() != ParameterMode.OUT) {

                    Object value;

                    // 获取属性名

                    String propertyName = parameterMapping.getProperty();

                    // 检测 BoundSql 的 additionalParameters 是否包含 propertyName

                    if (boundSql.hasAdditionalParameter(propertyName)) {

                        value = boundSql.getAdditionalParameter(propertyName);

                    } else if (parameterObject == null) {

                        value = null;

                    // 检测运行时参数是否有相应的类型解析器

                    } else if (typeHandlerRegistry.hasTypeHandler(parameterObject.getClass())) {

                        /*

                         * 若运行时参数的类型有相应的类型处理器 TypeHandler，则将

                         * parameterObject 设为当前属性的值。

                         */

                        value = parameterObject;

                    } else {

                        // 为用户传入的参数 parameterObject 创建元信息对象

                        MetaObject metaObject = configuration.newMetaObject(parameterObject);

                        // 从用户传入的参数中获取 propertyName 对应的值

                        value = metaObject.getValue(propertyName);

                    }

                    // ---------------------分割线---------------------

                    TypeHandler typeHandler = parameterMapping.getTypeHandler();

                    JdbcType jdbcType = parameterMapping.getJdbcType();

                    if (value == null && jdbcType == null) {

                        // 此处 jdbcType = JdbcType.OTHER

                        jdbcType = configuration.getJdbcTypeForNull();

                    }

                    try {

                        // 由类型处理器 typeHandler 向 ParameterHandler 设置参数

                        typeHandler.setParameter(ps, i + 1, value, jdbcType);

                    } catch (TypeException e) {

                        throw new TypeException(...);

                    } catch (SQLException e) {

                        throw new TypeException(...);

                    }

                }

            }

        }

    }

}

如上代码，分割线以上的大段代码用于获取 #{xxx} 占位符属性所对应的运行时参数。分割线以下的代码则是获取 #{xxx} 占位符属性对应的 TypeHandler，并在最后通过 TypeHandler 将运行时参数值设置到 PreparedStatement 中。关于 TypeHandler 的用途，我在本系列文章的导读一文介绍过，这里就不赘述了。大家若不熟悉，可以去看看。

2.2.5 #{} 占位符的解析与参数的设置过程梳理

前面两节的内容比较多，本节我将对前两节的部分内容进行梳理，以便大家能够更好理解这两节内容之间的联系。假设我们有这样一条 SQL 语句：

SELECT * FROM author WHERE name = #{name} AND age = #{age}

这个 SQL 语句中包含两个 #{} 占位符，在运行时这两个占位符会被解析成两个 ParameterMapping 对象。如下：

ParameterMapping{property='name', mode=IN, javaType=class java.lang.String, jdbcType=null, ...}

和

ParameterMapping{property='age', mode=IN, javaType=class java.lang.Integer, jdbcType=null, ...}

#{} 占位符解析完毕后，得到的 SQL 如下：

SELECT * FROM Author WHERE name = ? AND age = ?

这里假设下面这个方法与上面的 SQL 对应：

Author findByNameAndAge(@Param("name") String name, @Param("age") Integer age)

该方法的参数列表会被 ParamNameResolver 解析成一个 map，如下：

{

    0: "name",

    1: "age"

}

假设该方法在运行时有如下的调用：

findByNameAndAge("tianxiaobo", 20)    // 20岁，好年轻啊，但是回不去了呀

秒客网

MyBatis 源码分析 - SQL 的执行过程

* 本文速览

1.简介

2.SQL 执行过程分析

2.1 SQL 执行入口分析

2.1.1 为 Mapper 接口创建代理对象

2.1.2 执行代理逻辑

2.1.2.1 创建 MapperMethod 对象

① 创建 SqlCommand 对象

② 创建 MethodSignature 对象

2.1.2.2 执行 execute 方法

2.2 查询语句的执行过程分析

2.2.1 selectOne 方法分析

2.2.2 获取 BoundSql

2.2.2.1 DynamicContext

2.2.2.2 解析 SQL 片段

2.2.2.3 解析 #{} 占位符

2.2.3 创建 StatementHandler

2.2.4 设置运行时参数到 SQL 中

2.2.5 #{} 占位符的解析与参数的设置过程梳理

相关文章