博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
MySQL · 捉虫动态 · left-join多表导致crash
阅读量:6582 次
发布时间:2019-06-24

本文共 2816 字,大约阅读时间需要 9 分钟。

有一天小编胡乱写SQL, left join了30张表, 结果导致了Mysql server gone away…

我们来看看crash堆栈

base_list_iterator::nextupdate_ref_and_keysmake_join_statisticsJOIN::optimizemysql_execute_select

可以看出, 在产生执行计划过程中crash了。

追查

堆栈表明, update_ref_and_keys函数中join_tab->join->join_list为无效地址。 排查看到函数入口处这个变量还是ok的, 那么在gdb里watch一下。

Hardware watchpoint 4: join_tab->join->join_listOld value = (List
*) 0x3431f60New value = (List
*) 0xc800000000000000

这么整齐的地址一看就有问题。函数栈:

Key_field::Key_fieldadd_key_fieldadd_key_equal_fieldsadd_key_fieldsupdate_ref_and_keys

add_key_fields修改join_tab->join->join_list实际是不合理的, 因此这里说明一下路径上几个关键的函数。

原因分析

还要从子查询优化说起,当遇到semi-join子查询情况下, JOIN::optimize()会调用JOIN::flatten_subqueries改写SQL, 如下形式:

SELECT ...FROM ot1, ...WHERE oe IN (SELECT ie FROM it1, ..., itN WHERE subq_where)		AND outer_where

会被修改为:

SELECT ...FROM ot SEMI JOIN (it1, ... , itN),WHERE outer_where AND subq_where AND oe=ie

函数JOIN::flatten_subqueries, 做了以下几件事:

  • 创建semi join(it1, …, itN)的节点并添加到外层查询语句的FROM语法树下
  • subq_where AND oe=ie加入到外层查询语句的WHERE树下
  • 再移除原先的子查询语句

JOIN::flatten_subqueries中, 对于每一个子查询, 调用函数JOIN::convert_subquery_to_semijoin, 那么子查询上维护的query信息也要同步加到外部查询上。所以可见, 子查询中的信息, 会转交给外部查询。

之后, JOIN::optimize()调用update_ref_and_keys, 这个函数用来处理出最终查询要使用的索引。crash的问题也出现在这个函数中, 因此还要看update_ref_and_keys内部做了什么。

在函数update_ref_and_keys中, 一个重要的数组, key_fields, 用来存放所有可能用到的索引字段。先通过key_fields=(Key_field*) thd->alloc(sz)分配空间, 再调用add_key_fields递归遍历WHERE树, 遇到等值表达式, 会填充到key_fields数组中。而之前已经看到, add_key_field在写key_fields时却修改了join_tab->join->join_list

// add_key_fields中修改了join_tab->join->join_list的代码new (*key_fields)    Key_field(field, *value, and_level, exists_optimize, eq_func,              null_rejecting, NULL, get_semi_join_select_list_index(field));    (*key_fields)++;

可见在new的时候拿到了join_tab->join->join_list, 是(*key_fields++)的时候, 加过头了。从而可推断, key_fields没有分配到应该有的内存空间。那么出问题的就是sz用来分配空间的数字了。

// sz的计算方法sz= max(sizeof(Key_field), sizeof(SARGABLE_PARAM)) *    (((select_lex->cond_count + 1) * 2 +select_lex->between_count) * m + 1);

这里涉及到两个变量select_lex->cond_countselect_lex->between_count, 而cond_count就是number of conditions; 构造的语句中的等值表达式足有31条, 而这里在分配时是2, 活该内存越界。

而这个变量在子查询优化过程中, 子查询应该将其移交给外部查询语句。

修复

函数JOIN::convert_subquery_to_semijoin中, 改写完SQL后, 忘记把子查询的cond_count和between_cond信息更新到外部查询了, 这时只要手动添加即可。

复现

可以通过以下方式复现

create table t1 (  `id` int(20),  `col3` varchar(60) default null,  primary key (id));create view `v_test` asselect t1.col1 as col1,      t2.col2 as col2,      ...      t30.col30 as col30      from (((((((((((((((((((((((((((((t1          left join t2 on (t1.id = t2.id))          left join t3 on (t1.id = t3.id))          ...          left join t30 on (t1.id = t30.id));

然后执行

create table tt (id int(20), b varchar(200));select * from tt where b in (select col1_1 fromom v_test);

MySQL5.6在5.6.25之前的小版本都可以复现, 请尽情调戏 .^.

转载地址:http://qnsno.baihongyu.com/

你可能感兴趣的文章
为Exchange server 2013 申请多域名证书
查看>>
处理svn的 File '/aa' is out of date
查看>>
解决 Ubuntu 16.04 LTSSublime text3中文问题
查看>>
mysql主从复制实现数据库同步
查看>>
面试-1
查看>>
CentOS自动登录Gnome
查看>>
第一章,重点总结
查看>>
LeetCode - 49. Group Anagrams
查看>>
移动前端不得不了解的html5 head 头标签
查看>>
Tomcat 服务器性能优化
查看>>
【框架学习】ibatis DAO框架分析
查看>>
ZOJ 3640 Help Me Escape
查看>>
putty与emacs
查看>>
C#下实现的半角转与全角的互转
查看>>
PreparedStatement vs Statement
查看>>
使用texturePaker批量转化pvr为pn
查看>>
自我介绍
查看>>
截取指定网站Html编码
查看>>
作业一 统计软件简介与数据操作
查看>>
css布局
查看>>