拔高SQL效率

2012-08-25

提高SQL效率?下面就某些SQL 语句的 where 子句编写中需要注意的问题作详细介绍。在这些 where 子句中，即使

提高SQL效率

下面就某些SQL 语句的 where 子句编写中需要注意的问题作详细介绍。在这些 where 子句中，即使某些列存在索引，但是由于编写了劣质的 SQL ，系统在运行该 SQL 语句时也不能使用该索引，而同样使用全表扫描，这就造成了响应速度的极大降低。?

1.?IS?NULL?与? IS?NOT?NULL?

不能用null 作索引，任何包含 null 值的列都将不会被包含在索引中。即使索引有多列这样的情况下，只要这些列中有一列含有 null ，该列就会从索引中排除。也就是说如果某列存在空值，即使对该列建索引也不会提高性能。?

任何在where 子句中使用 is?null 或 is?not?null 的语句优化器是不允许使用索引的。?

2.?联接列?

对于有联接的列，即使最后的联接值为一个静态值，优化器是不会使用索引的。我们一起来看一个例子，假定有一个职工表（employee ），对于一个职工的姓和名分成两列存放（ FIRST_NAME 和 LAST_NAME ），现在要查询一个叫比尔 . 克林顿（ Bill?Cliton ）的职工。?

下面是一个采用联接查询的SQL 语句，?

select?*?from?employss?
where?
first_name||'||last_name?='Beill?Cliton'?

上面这条语句完全可以查询出是否有Bill?Cliton 这个员工，但是这里需要注意，系统优化器对基于 last_name 创建的索引没有使用。?

当采用下面这种SQL 语句的编写， Oracle 系统就可以采用基于 last_name 创建的索引。?

Select?*?from?employee?

where?

first_name?='Beill'?and?last_name?='Cliton'?

遇到下面这种情况又如何处理呢？如果一个变量（name ）中存放着 Bill?Cliton 这个员工的姓名，对于这种情况我们又如何避免全程遍历，使用索引呢？可以使用一个函数，将变量 name 中的姓和名分开就可以了，但是有一点需要注意，这个函数是不能作用在索引列上。下面是 SQL 查询脚本：?

select?*?from?employee?

where?

first_name?=?SUBSTR('&&name',1,INSTR('&&name','?')-1)?

and?

last_name?=?SUBSTR('&&name',INSTR('&&name’,'?')+1)?

3.?带通配符（ % ）的 like 语句?

同样以上面的例子来看这种情况。目前的需求是这样的，要求在职工表中查询名字中包含cliton 的人。可以采用如下的查询 SQL 语句：?

select?*?from?employee?where?last_name?like?'%cliton%'?

这里由于通配符（% ）在搜寻词首出现，所以 Oracle 系统不使用 last_name 的索引。在很多情况下可能无法避免这种情况，但是一定要心中有底，通配符如此使用会降低查询速度。然而当通配符出现在字符串其他位置时，优化器就能利用索引。在下面的查询中索引得到了使用：?

select?*?from?employee?where?last_name?like?'c%'?

4.?Order?by语句 ?

ORDER?BY语句决定了 Oracle 如何将返回的查询结果排序。 Order?by 语句对要排序的列没有什么特别的限制，也可以将函数加入列中（象联接或者附加等）。任何在 Order?by 语句的非索引项或者有计算表达式都将降低查询速度。?

仔细检查order?by 语句以找出非索引项或者表达式，它们会降低性能。解决这个问题的办法就是重写 order?by 语句以使用索引，也可以为所使用的列建立另外一个索引，同时应绝对避免在 order?by 子句中使用表达式。?

5.?NOT?

我们在查询时经常在where 子句使用一些逻辑表达式，如大于、小于、等于以及不等于等等，也可以使用 and （与）、 or （或）以及 not （非）。 NOT 可用来对任何逻辑运算符号取反。下面是一个 NOT 子句的例子：?

...?where?not?(status?='VALID')?

如果要使用NOT ，则应在取反的短语前面加上括号，并在短语前面加上 NOT 运算符。 NOT 运算符包含在另外一个逻辑运算符中，这就是不等于（ <>; ）运算符。换句话说，即使不在查询 where 子句中显式地加入 NOT 词， NOT 仍在运算符中，见下例：?

...?where?status?<>;'INVALID'?

再看下面这个例子：?

select?*?from?employee?where?salary<>;3000;?

对这个查询，可以改写为不使用NOT ：?

select?*?from?employee?where?salary<3000?or?salary>;3000;?

虽然这两种查询的结果一样，但是第二种查询方案会比第一种查询方案更快些。第二种查询允许Oracle 对 salary 列使用索引，而第一种查询则不能使用索引。?

6.?IN和 EXISTS?

有时候会将一列和一系列值相比较。最简单的办法就是在where 子句中使用子查询。在 where 子句中可以使用两种格式的子查询。?

第一种格式是使用IN 操作符：?

...?where?column?in(select?*?from?...?where?...);?

第二种格式是使用EXIST 操作符：?

...?where?exists?(select?'X'?from?...where?...);?

我相信绝大多数人会使用第一种格式，因为它比较容易编写，而实际上第二种格式要远比第一种格式的效率高。在Oracle 中可以几乎将所有的 IN 操作符子查询改写为使用 EXISTS 的子查询。?

第二种格式中，子查询以‘select?'X' 开始。运用 EXISTS 子句不管子查询从表中抽取什么数据它只查看 where 子句。这样优化器就不必遍历整个表而仅根据索引就可完成工作（这里假定在 where 语句中使用的列存在索引）。相对于 IN 子句来说， EXISTS 使用相连子查询，构造起来要比 IN 子查询困难一些。?

通过使用EXIST ， Oracle 系统会首先检查主查询，然后运行子查询直到它找到第一个匹配项，这就节省了时间。 Oracle 系统在执行 IN 子查询时，首先执行子查询，并将获得的结果列表存放在在一个加了索引的临时表中。在执行子查询之前，系统先将主查询挂起，待子查询执行完毕，存放在临时表中以后再执行主查询。这也就是使用 EXISTS 比使用 IN 通常查询速度快的原因。?

同时应尽可能使用NOT?EXISTS 来代替 NOT?IN ，尽管二者都使用了 NOT （不能使用索引而降低速度）， NOT?EXISTS 要比 NOT?IN 查询效率更高。

==============================另外的一篇文章===============================================

基本的Sql编写注意事项

尽量少用IN操作符，基本上所有的IN操作符都可以用EXISTS代替。不用NOT IN操作符，可以用NOT EXISTS或者外连接+替代。Oracle在执行IN子查询时，首先执行子查询，将查询结果放入临时表再执行主查询。而EXIST则是首先检查主查询，然后运行子查询直到找到第一个匹配项。NOT EXISTS比NOT IN效率稍高。但具体在选择IN或EXIST操作时，要根据主子表数据量大小来具体考虑。不用“<>”或者“!=”操作符。对不等于操作符的处理会造成全表扫描，可以用“<” or “>”代替。Where子句中出现IS NULL或者IS NOT NULL时，Oracle会停止使用索引而执行全表扫描。可以考虑在设计表时，对索引列设置为NOT NULL。这样就可以用其他操作来取代判断NULL的操作。

当通配符“%”或者“_”作为查询字符串的第一个字符时，索引不会被使用。对于有连接的列“||”，最后一个连接列索引会无效。尽量避免连接，可以分开连接或者使用不作用在列上的函数替代。如果索引不是基于函数的，那么当在Where子句中对索引列使用函数时，索引不再起作用。Where子句中避免在索引列上使用计算，否则将导致索引失效而进行全表扫描。对数据类型不同的列进行比较时，会使索引失效。用“>=”替代“>”。UNION操作符会对结果进行筛选，消除重复，数据量大的情况下可能会引起磁盘排序。如果不需要删除重复记录，应该使用UNION ALL。Oracle从下到上处理Where子句中多个查询条件，所以表连接语句应写在其他Where条件前，可以过滤掉最大数量记录的条件必须写在Where子句的末尾。Oracle从右到左处理From子句中的表名，所以在From子句中包含多个表的情况下，将记录最少的表放在最后。（只在采用RBO优化时有效，下文详述） Order By语句中的非索引列会降低性能，可以通过添加索引的方式处理。严格控制在Order By语句中使用表达式。不同区域出现的相同的Sql语句，要保证查询字符完全相同，以利用SGA共享池，防止相同的Sql语句被多次分析。多利用内部函数提高Sql效率。当在Sql语句中连接多个表时，使用表的别名，并将之作为每列的前缀。这样可以减少解析时间。

需要注意的是，随着Oracle的升级，查询优化器会自动对Sql语句进行优化，某些限制可能在新版本的Oracle下不再是问题。尤其是采用CBO（Cost-Based Optimization，基于代价的优化方式）时。

我们可以总结一下可能引起全表扫描的操作：

在索引列上使用NOT或者“<>”;对索引列使用函数或者计算；NOT IN操作；通配符位于查询字符串的第一个字符；IS NULL或者IS NOT NULL；多列索引，但它的第一个列并没有被Where子句引用；

Oracle优化器

Oracle优化器（Optimizer）是Oracle在执行SQL之前分析语句的工具。
Oracle的优化器有两种优化方式：基于规则的（RBO）和基于代价的（CBO）。

RBO： 优化器遵循Oracle内部预定的规则。CBO： 依据语句执行的代价，主要指对CPU和内存的占用。优化器在判断是否使用CBO时，要参照表和索引的统计信息。统计信息要在对表做analyze后才会有。Oracle8及以后版本，推荐用CBO方式。

Oracle优化器的优化模式主要有四种：

Rule：基于规则；Choose：默认模式。根据表或索引的统计信息，如果有统计信息，则使用CBO方式；如果没有统计信息，相应列有索引，则使用RBO方式。First rows：与Choose类似。不同的是如果表有统计信息，它将以最快的方式返回查询的前几行，以获得最佳响应时间。All rows：即完全基于Cost的模式。当一个表有统计信息时，以最快方式返回表所有行，以获得最大吞吐量。没有统计信息则使用RBO方式。

设定优化模式的方式

Instance级别：在init<SID>.ora文件中设定OPTIMIZER_MODE；Session级别：通过SQL> ALTER SESSION SET OPTIMIZER_MODE=;来设定。语句级别：通过SQL> SELECT /*+ALL+_ROWS*/ ……;来设定。可用的HINT包括/*+ALL_ROWS*/、/*+FIRST_ROWS*/、/*+CHOOSE*/、/*+RULE*/ 等。

要注意的是，如果表有统计信息，则可能造成语句不走索引的结果。可以用SQL>ANALYZE TABLE table_name DELETE STATISTICS; 删除索引。
对列和索引更新统计信息的SQL：
SQL> ANALYZE TABLE table_name COMPUTE STATISTICS;
SQL> ANALYZE INDEX index_name ESTIMATE STATISTICS;

热点排行

SQL Server

拔高SQL效率