title | summary | aliases | |
---|---|---|---|
SQL 操作常见问题 |
介绍 SQL 操作相关的常见问题。 |
|
本文档介绍 TiDB 中常见的 SQL 操作问题。
支持。你可以在具有唯一二级索引的非主键列上设置 NOT NULL
约束。在这种情况下,该列用作二级键。
TiDB 在对大表执行 DDL 操作时,一般不会有什么问题。TiDB 支持在线 DDL 操作,且这些 DDL 操作不会阻塞 DML 操作。
对于添加列、删除列或删除索引等 DDL 操作,TiDB 可以快速完成这些操作。
对于添加索引等 DDL 操作,TiDB 需要进行回填 (backfill) 操作,这个过程需要较长的时间(取决于表的大小)和额外的资源消耗。对在线业务的影响可调节。TiDB 可以通过多线程进行 backfill,资源消耗可通过以下系统变量进行设置:
tidb_ddl_reorg_worker_cnt
tidb_ddl_reorg_priority
tidb_ddl_error_count_limit
tidb_ddl_reorg_batch_size
TiDB 包含一个基于成本的优化器。在大多数情况下,优化器会为你选择最优的查询计划。如果优化器工作欠佳,你可以使用优化器提示来干预优化器。
另外,你还可以使用执行计划绑定来为特定的 SQL 语句固定查询计划。
你可以使用 MAX_EXECUTION_TIME
Hint 来创建 SQL 绑定,将特定语句的执行时间限制为一个较小的值(例如 1ms)。这样,语句就会在超过限制时自动终止。
例如,要阻止执行 SELECT * FROM t1, t2 WHERE t1.id = t2.id
,可以使用以下 SQL 绑定将语句的执行时间限制为 1ms:
CREATE GLOBAL BINDING for
SELECT * FROM t1, t2 WHERE t1.id = t2.id
USING
SELECT /*+ MAX_EXECUTION_TIME(1) */ * FROM t1, t2 WHERE t1.id = t2.id;
注意:
MAX_EXECUTION_TIME
的精度大约为 100ms。在 TiDB 终止 SQL 语句之前,TiKV 中的任务可能已经开始执行。为了减少这种情况下 TiKV 的资源消耗,建议将系统变量tidb_enable_paging
的值设置为ON
。
删除该 SQL 绑定可以移除限制。
DROP GLOBAL BINDING for
SELECT * FROM t1, t2 WHERE t1.id = t2.id;
详细可参考系统变量。
这不是 bug。返回结果的顺序视不同情况而定,不保证顺序统一。
MySQL 中,返回结果的顺序可能较为固定,因为查询是通过单线程执行的。但升级到新版本后,查询计划也可能变化。无论是否期待返回结果有序,都推荐使用 ORDER BY
条件。
ISO/IEC 9075:1992, Database Language SQL- July 30, 1992 对此有如下表述:
If an
<order by clause>
is not specified, then the table specified by the<cursor specification>
is T and the ordering of rows in T is implementation-dependent.(如果未指定<order by 条件>
,通过<cursor specification>
指定的表为 T,那么 T 表中的行顺序视执行情况而定。)
以下两条查询的结果都是合法的:
> select * from t;
+------+------+
| a | b |
+------+------+
| 1 | 1 |
| 2 | 2 |
+------+------+
2 rows in set (0.00 sec)
> select * from t; -- 不确定返回结果的顺序
+------+------+
| a | b |
+------+------+
| 2 | 2 |
| 1 | 1 |
+------+------+
2 rows in set (0.00 sec)
如果 ORDER BY
中使用的列不是唯一列,就无法确定该语句返回结果的顺序。在以下示例中,a
列有重复值,因此只有 ORDER BY a, b
能确定返回结果的顺序。
> select * from t order by a;
+------+------+
| a | b |
+------+------+
| 1 | 1 |
| 2 | 1 |
| 2 | 2 |
+------+------+
3 rows in set (0.00 sec)
在以下示例中,order by a
能确定 a 列的顺序,但不能确定 b 列的顺序。
> select * from t order by a;
+------+------+
| a | b |
+------+------+
| 1 | 1 |
| 2 | 2 |
| 2 | 1 |
+------+------+
3 rows in set (0.00 sec)
在 TiDB 中,你还可以使用系统变量 tidb_enable_ordered_result_mode
来指定是否对最终的输出结果进行自动排序。
支持。当 TiDB 使用悲观锁(自 TiDB v3.0 起默认使用)时,TiDB 中 SELECT FOR UPDATE
的行为与 MySQL 中的基本一致。
当 TiDB 使用乐观锁时,SELECT FOR UPDATE
不会在事务启动时对数据加锁,而是在提交事务时检查冲突。如果检查出冲突,会回滚待提交的事务。
详情参考 SELECT 语句语法元素说明。
TiDB 字符集默认就是 UTF8 而且目前只支持 UTF8,字符串就是 memcomparable 格式的。
一个事务中的语句数量,默认限制最大为 5000 条。
在使用乐观事务并开启事务重试的情况下,默认限制 5000,可通过 stmt-count-limit
调整。
TiDB 的自增 ID (AUTO_INCREMENT
) 只保证自增且唯一,并不保证连续分配。TiDB 目前采用批量分配的方式,所以如果在多台 TiDB server 上同时插入数据,分配的自增 ID 会不连续。当多个线程并发往不同的 TiDB server 插入数据的时候,有可能会出现后插入的数据自增 ID 小的情况。此外,TiDB 允许给整型类型的字段指定 AUTO_INCREMENT,且一个表只允许一个属性为 AUTO_INCREMENT
的字段。详情可参考自增 ID和 AUTO_INCREMENT。
TiDB 支持在会话或全局作用域上修改 sql_mode
系统变量。
- 对全局作用域变量的修改,设置后将作用于集群中的其它服务器,并且重启后更改依然有效。因此,你无需在每台 TiDB 服务器上都更改
sql_mode
的值。 - 对会话作用域变量的修改,设置后只影响当前会话,重启后更改消失。
用 Sqoop 批量写入 TiDB 数据,虽然配置了 --batch
选项,但还是会遇到 java.sql.BatchUpdateExecption:statement count 5001 exceeds the transaction limitation
的错误,该如何解决?
问题原因:在 Sqoop 中,--batch
是指每个批次提交 100 条 statement,但是默认每个 statement 包含 100 条 SQL 语句,所以此时 100 * 100 = 10000 条 SQL 语句,超出了 TiDB 的事务限制 5000 条。
解决办法:
-
增加选项
-Dsqoop.export.records.per.statement=10
,完整的用法如下:sqoop export \ -Dsqoop.export.records.per.statement=10 \ --connect jdbc:mysql://mysql.example.com/sqoop \ --username sqoop ${user} \ --password ${passwd} \ --table ${tab_name} \ --export-dir ${dir} \ --batch
-
也可以选择增大 TiDB 的单个事物语句数量限制,不过此操作会导致内存增加。详情参见 SQL 语句的限制。
有,也支持 DDL。详细参考使用 AS OF TIMESTAMP 语法读取历史数据。
在 TiDB 中使用 DELETE
,TRUNCATE
和 DROP
语句删除数据都不会立即释放空间。对于 TRUNCATE
和 DROP
操作,在达到 TiDB 的 GC (garbage collection) 时间后(默认 10 分钟),TiDB 的 GC 机制会删除数据并释放空间。对于 DELETE 操作,TiDB 的 GC 机制会删除数据,但不会立即释放空间,而是等到后续进行 compaction 时释放空间。
删除大量数据后,会有很多无用的 key 存在,影响查询效率。要解决该问题,可以尝试开启 Region Merge 功能,具体可参考最佳实践中的删除数据部分。
TiDB 采用了多版本并发控制 (MVCC) 机制,当新写入的数据覆盖旧的数据时,旧的数据不会被替换掉,而是与新写入的数据同时保留,并以时间戳来区分版本。为了使并发事务能查看到早期版本的数据,删除数据时 TiDB 不会立即回收空间,而是等待一段时间后再进行垃圾回收 (GC)。要配置历史数据的保留时限,你可以修改系统变量 tidb_gc_life_time
的值(默认值为 10m0s
)。
TiDB 中的 SHOW PROCESSLIST
与 MySQL 中的 SHOW PROCESSLIST
显示内容基本一致,不会显示系统进程号。而返回结果中的 ID 表示当前的 session ID。其中 TiDB 的 SHOW PROCESSLIST
和 MySQL 的 SHOW PROCESSLIST
区别如下:
-
由于 TiDB 是分布式数据库,TiDB server 实例是无状态的 SQL 解析和执行引擎(详情可参考 TiDB 整体架构),用户使用 MySQL 客户端登录的是哪个 TiDB server,
SHOW PROCESSLIST
就会显示当前连接的这个 TiDB server 中执行的 session 列表,不是整个集群中运行的全部 session 列表;而 MySQL 是单机数据库,SHOW PROCESSLIST
列出的是当前整个 MySQL 数据库的全部执行 SQL 列表。 -
在查询执行期间,TiDB 中的
State
列不会持续更新。由于 TiDB 支持并行查询,每个语句可能同时处于多个状态,因此很难显示为某一种状态。
TiDB 支持改变全局或单个语句的优先级。优先级包括:
- HIGH_PRIORITY:该语句为高优先级语句,TiDB 在执行阶段会优先处理这条语句
- LOW_PRIORITY:该语句为低优先级语句,TiDB 在执行阶段会降低这条语句的优先级
以上两种参数可以结合 TiDB 的 DML 语言进行使用,使用方法举例如下:
-
通过在数据库中写 SQL 的方式来调整优先级:
{{< copyable "sql" >}}
select HIGH_PRIORITY | LOW_PRIORITY count(*) from table_name; insert HIGH_PRIORITY | LOW_PRIORITY into table_name insert_values; delete HIGH_PRIORITY | LOW_PRIORITY from table_name; update HIGH_PRIORITY | LOW_PRIORITY table_reference set assignment_list where where_condition; replace HIGH_PRIORITY | LOW_PRIORITY into table_name;
-
全表扫会自动调整为低优先级,analyze 也是默认低优先级。
触发策略:如果一张新表达到 1000 条记录,并且在 1 分钟内没有写入,会自动触发。
当表的(修改数/当前总行数)比例大于 tidb_auto_analyze_ratio
的时候,会自动触发 analyze
语句。tidb_auto_analyze_ratio
的默认值为 0.5,即默认开启触发 auto analyze。为了保险起见,在开启 auto analyze 的时候,tidb_auto_analyze_ratio
的最小值为 0.3。但是该变量值不能大于等于 pseudo-estimate-ratio
(默认值为 0.8),否则会有一段时间使用 pseudo 统计信息,建议设置值为 0.5。
你可以用系统变量 tidb_enable_auto_analyze
关闭 auto analyze。
在 TiDB 中,你可以用多种方法控制查询优化器的默认行为,包括使用 Optimizer Hints 和 SQL 执行计划管理 (SPM)。基本用法同 MySQL 中的一致,还包含若干 TiDB 特有的用法,例如:select column_name from table_name use index(index_name)where where_condition;
。
TiDB 在执行 SQL 语句时,会使用当时的 schema
来处理该 SQL 语句,而且 TiDB 支持在线异步变更 DDL。那么,在执行 DML 的时候可能有 DDL 语句也在执行,而你需要确保每个 SQL 语句在同一个 schema
上执行。所以当执行 DML 时,遇到正在执行中的 DDL 操作就可能会报 Information schema is changed
的错误。
报错的可能原因如下:
- 原因 1:正在执行的 DML 所涉及的表和集群中正在执行的 DDL 的表有相同的,那么这个 DML 语句就会报此错。可以通过命令
admin show ddl job
查看正在执行的 DDL 操作。 - 原因 2:这个 DML 执行时间很久,而这段时间内执行了很多 DDL 语句,导致中间
schema
版本变更次数超过 1024 (此为默认值,可以通过tidb_max_delta_schema_count
变量修改)。 - 原因 3:接受 DML 请求的 TiDB 长时间不能加载到
schema information
(TiDB 与 PD 或 TiKV 之间的网络连接故障等会导致此问题),而这段时间内执行了很多 DDL 语句,导致中间schema
版本变更次数超过 100。 - 原因 4:TiDB 重启后执行第一个 DDL 操作前,执行 DML 操作,并且在执行过程中遇到了第 1 个 DDL 操作(即在执行第 1 个 DDL 操作前,启动该 DML 对应的事务,且在该 DDL 变更第一个
schema
版本后,提交该 DML 对应的事务),那么这个 DML 会报此错。
以上原因中,只有原因 1 与表有关。原因 1 和原因 2 都不会导致业务问题,相应的 DML 会在失败后重试。对于原因 3,需要检查 TiDB 实例和 PD 及 TiKV 的网络情况。
注意:
- 目前 TiDB 未缓存所有的
schema
版本信息。- 对于每个 DDL 操作,
schema
版本变更的数量与对应schema state
变更的次数一致。- 不同的 DDL 操作版本变更次数不一样。例如,
create table
操作会有 1 次schema
版本变更;add column
操作有 4 次schema
版本变更。
当执行 DML 时,TiDB 超过一个 DDL lease 时间(默认 45s)没能加载到最新的 schema 就可能会报 Information schema is out of date
的错误。遇到此错的可能原因如下:
- 执行此 DML 的 TiDB 被 kill 后准备退出,且此 DML 对应的事务执行时间超过一个 DDL lease,在事务提交时会报这个错误。
- TiDB 在执行此 DML 时,有一段时间内连不上 PD 或者 TiKV,导致 TiDB 超过一个 DDL lease 时间没有 load schema,或者导致 TiDB 断开与 PD 之间带 keep alive 设置的连接。
高并发场景下执行 DDL 语句(比如批量建表)时,极少部分的 DDL 语句可能会由于并发执行时 key 冲突而执行失败。
并发执行 DDL 语句时,建议将 DDL 语句数量保持在 20 以下,否则你需要在应用端重试失败的 DDL 语句。
详细解读理解 TiDB 执行计划。
详细解读统计信息。
Count 就是暴力扫表,提高并发度能显著提升扫表速度。如要调整并发度,可以使用 tidb_distsql_scan_concurrency
变量,但调整并发度需要同时考虑 CPU 和 I/O 资源。TiDB 每次执行查询时,都要访问 TiKV。在数据量小的情况下,MySQL 的数据都在内存里,而 TiDB 还需要进行一次网络访问。
加速建议:
- 提升硬件配置,可以参考部署建议。
- 提升并发度,默认是 10,可以尝试提升到 50,但是一般提升幅度在 2-4 倍之间。
- 测试大数据量的 count。
- 调优 TiKV 配置,可以参考性能调优。
- 参考下推计算结果缓存。
通过 ADMIN SHOW DDL
语句查看当前 job 进度。操作如下:
ADMIN SHOW DDL;
*************************** 1. row ***************************
SCHEMA_VER: 140
OWNER: 1a1c4174-0fcd-4ba0-add9-12d08c4077dc
RUNNING_JOBS: ID:121, Type:add index, State:running, SchemaState:write reorganization, SchemaID:1, TableID:118, RowCount:77312, ArgLen:0, start time: 2018-12-05 16:26:10.652 +0800 CST, Err:<nil>, ErrCount:0, SnapshotVersion:404749908941733890
SELF_ID: 1a1c4174-0fcd-4ba0-add9-12d08c4077dc
从以上返回结果可知,当前正在处理的是 ADD INDEX
操作。且从 RUNNING_JOBS
列的 RowCount
字段可以知道当前 ADD INDEX
操作已经添加了 77312 行索引。
可以使用 ADMIN SHOW DDL
语句查看正在运行的 DDL 作业。
ADMIN SHOW DDL JOBS
:用于查看当前 DDL 作业队列中的所有结果(包括正在运行以及等待运行的任务)以及已执行完成的 DDL 作业队列中的最近十条结果。ADMIN SHOW DDL JOBS QUERIES 'job_id' [, 'job_id'] ...
:用于显示job_id
对应的 DDL 任务的原始 SQL 语句。此job_id
只搜索正在执行中的任务以及 DDL 历史作业队列中的最近十条结果。
是的,TiDB 基于成本的优化器 (CBO) 对代价模型、统计信息进行持续优化。除此之外,TiDB 还支持 hash join、soft-merge join 等 join 算法。
可以通过 SHOW STATS_HEALTHY
来查看 Healthy 字段,一般该字段值小于等于 60 的表需要做 analyze。
ID 没什么规律,只要是唯一就行。不过在生成执行计划时,有一个计数器,生成一个计划 ID 后序号就加 1,执行的顺序和序号无关。整个执行计划是一颗树,执行时从根节点开始,不断地向上返回数据。要理解执行计划,请参考理解 TiDB 执行计划。
目前 TiDB 的计算任务隶属于两种不同的 task:cop task 和 root task。cop task 是指被下推到 KV 端分布式执行的计算任务,root task 是指在 TiDB 端单点执行的计算任务。
一般来讲 root task 的输入数据是来自于 cop task 的,但是 root task 在处理数据的时候,TiKV 上的 cop task 也可以同时处理数据,等待 TiDB 的 root task 拉取。所以从这个过程来看,root task 和 cop task 是并行的,同时存在数据上下游关系。
在执行的过程中,某些时间段也可能是并行的,第一个 cop task 在处理 [100, 200] 的数据,第二个 cop task 在处理 [1, 100] 的数据。执行计划的理解,请参考理解 TiDB 执行计划。
详情参考 TiDB 配置参数。
要了解热点问题的场景,请参考常见热点问题。TiDB 的以下特性旨在帮助解决热点问题:
SHARD_ROW_ID_BITS
属性。设置该属性后,行 ID 会被打散并写入多个 Region,以缓解写入热点问题。AUTO_RANDOM
属性,用于解决自增主键带来的热点问题。- Coprocessor Cache,针对小表的读热点问题。
- Load Base Split,针对因 Region 访问不均衡(例如小表全表扫)而导致的热点问题。
- 缓存表,针对被频繁访问但更新较少的小热点表。
如果你遇到因热点引起的性能问题,可参考处理热点问题。
详情参考 TiKV 性能参数调优。