场景:导入会员数据,出现了重复数据在库里面。导入过程中有身份证号的唯一检查,怎么还会重复呢。百思不得其解。。。
万恶的网络延迟。。。。
仔细查了遍代码,发现身份证号检查速度特别慢,造成了网络阻塞。。。
对于用户来说不知道怎么回事(以为没反应),点击了导入。。。两个线程之间几乎没有时间差。所以即使有检查,也没管用。
解决案
1.优化身份证号的检查,并在表中为身份证号加索引
2.mybatis上做的手脚,重复时候不插入。
- 1.如果某些关键字段已经在Mysql中存在了,不要重复插入,而是改为更新某些字段。
- 2.如果某些关键字段已经在Mysql中存在了,不要重复插入,也不需要做更新操作,直接忽略即可。
1、针对上面的第一种,mysql提供了insert into ... on duplicate key update ... 语法(Mysql自己的语法,不属于标准SQL)来实现。这种场景相对常见。使用的前提是,需要定义主键或者 唯一性索引,用来告诉Mysql哪些字段的重复会造成主键冲突或者违背唯一性约束条件。当这些情况出现时,就放弃insert操作,转而执行后面的update操作。上一个具体的例子,在ibatis 中写的一个上面逻辑的sql:
- <statement id="testInsertOnDuplicateKeyUpdate"
- parameterClass="com.alibaba.ais.bdc.person.dataobject.UserInfo">
- <!--Here the employ_id has been defined as a primary key-->
- insert into T_USER_INFO (employ_id,fans_count,follow_count)
- values (#employId#,#fansCount#,#followCount#)
- ON DUPLICATE KEY UPDATE follow_countfollow_count=follow_count+1
- </statement>
上面的插入操作就会在employ_id发生主键冲突的时候,转变为更新follow_count字段(自增一个单位)。
2、针对上面的第二种,mysql提供了insert ignore into ... 语法(Mysql自己的语法,不属于标准SQL)来实现。这种场景相对要少见一些。 使用的前提是,需要定义主键或者唯一性索引,原因同上面一致。但不同的就是,违背唯一性约束时,直接忽略这次insert操作,然后啥也不干了,也不会报错。。。
但这里有个问题,就是有时业务本身还是需要知道语句到底执行了insert还是没有执行!因为需要根据这个反馈信息,做出不同的处理逻辑。这里给出使用ibatis时,两种不同的处理方法。
- 借助mysql的内置函数row_count()和ibatis的selectKey标签:
- 关于ibatis的selectKey标签,更为常见的用法是在插入对象到DB之后,返回DB自增产生的主键ID。比如:
-
- <insert id="testSelectKey">
- insert into T_TEST(WATCHER, WATCHEE) values (#watcher#,#watchee#)
- <selectKey resultClass="int" keyProperty="id">
- select last_insert_id() as ID from dependency limit 1
- </selectKey>
- lt;/insert>
- 通过上面语句进行插入操作之后,可以通过如下方式在Java代码中获得这个DB自增产生的ID:
-
- Integer id = (Integer) sqlMapClient.insert("testSelectKey", param);
-
- row_count()是Mysql提供可以获得insert、update、delete这几种操作成功处理行数的一个内置函数,有了这个函数,再结合上面给出的selectKey标签的例子,就可以做到获得insert ignore时,成功insert的行数。有了这个行数,也就知道了到底有没有发生insert操作。(发生了插入操作该函数返回值会大于0),于是改编一下上面的sql-map中的sql(注意其中的ignore关键字):
-
- <insert id="testInsertIgnore">
- insert ignore into T_TEST(WATCHER, WATCHEE) values (#watcher#,#watchee#)
- <selectKey resultClass="int" keyProperty="id">
- select row_count() as ID from T_USER_RELATION limit 1
- </selectKey>
- lt;/insert>
-
- Integer affectedRows = (Integer)sqlMapClient.insert("testInsertIgnore", param);
-
- 关于ibatis的selectKey标签,更为常见的用法是在插入对象到DB之后,返回DB自增产生的主键ID。比如:
- 利用ibatis的update语句:上面之所以要费劲周折的修改insert语句,时因为ibatis本身的insert不是默认支持返回影响的行数的。但是update语句支持!于是,另外一个思路,就是利用update语句来完成这个insert操作。
-
- <update id="testInsertIgnore">
- insert ignore into T_USER_RELATION(WATCHER, WATCHEE) values (#watcher#,#watchee#)
- <!--Without selectKey tag, it looks mush more concise-->
- </update>
-
- Integer affectedRows = (Integer)sqlMapClient.update("testInsertIgnore", param);
-
教训:可能开发人员为了省事,喜欢共用sql文。但是一个小小的检查其实是不需要关联那么多表的。共用后,导致检查时间过慢。
特别是表数据量较大的时候非常明显。建议,新写个检查的sql