title | summary | category |
---|---|---|
TiDB 事务概览 |
了解 TiDB 中的事务。 |
reference |
TiDB 支持完整的分布式事务,提供乐观事务与悲观事务(TiDB 3.0 中引入)两种事务模型。本文主要介绍涉及到事务的语句、显式/隐式事务、事务的隔离级别和惰性检查,以及事务大小的限制。
常用的变量包括 autocommit
、tidb_disable_txn_auto_retry
以及 tidb_retry_limit
。
语法:
{{< copyable "sql" >}}
BEGIN;
{{< copyable "sql" >}}
START TRANSACTION;
{{< copyable "sql" >}}
START TRANSACTION WITH CONSISTENT SNAPSHOT;
以上三条语句都用于开启事务,效果相同。执行开启事务语句可以显式地开启一个新的事务。如果执行以上语句时,当前 Session 正处于一个事务的中间过程,那么系统会先自动提交当前事务,再开启一个新的事务。
语法:
{{< copyable "sql" >}}
COMMIT;
该语句用于提交当前的事务,包括从 [BEGIN|START TRANSACTION]
到 COMMIT
之间的所有修改。
语法:
{{< copyable "sql" >}}
ROLLBACK;
该语句用于回滚当前事务,撤销从 [BEGIN|START TRANSACTION]
到 ROLLBACK
之间的所有修改。
语法:
{{< copyable "sql" >}}
SET autocommit = {0 | 1}
当 autocommit = 1
时(默认),当前的 Session 为自动提交状态,即每条语句运行后,TiDB 会自动将修改提交到数据库中。设置 autocommit = 0
时更改当前 Session 更改为非自动提交状态,通过执行 COMMIT
语句来手动提交事务。
注意:
某些语句执行后会导致隐式提交。例如,执行
[BEGIN|START TRANCATION]
语句时,TiDB 会试图提交上一个事务,并开启一个新的事务。详情参见 implicit commit。
另外,autocommit
也是一个系统变量,你可以通过变量赋值语句修改当前 Session 或 Global 的值。
{{< copyable "sql" >}}
SET @@SESSION.autocommit = {0 | 1};
{{< copyable "sql" >}}
SET @@GLOBAL.autocommit = {0 | 1};
TiDB 可以显式地使用事务(通过 [BEGIN|START TRANSACTION]
/COMMIT
语句定义事务的开始和结束) 或者隐式地使用事务 (SET autocommit = 1
)。
在自动提交状态下,使用 [BEGIN|START TRANSACTION]
语句会显式地开启一个事务,同时也会禁用自动提交,使隐式事务变成显式事务。直到执行 COMMIT
或 ROLLBACK
语句时才会恢复到此前默认的自动提交状态。
对于 DDL 语句,会自动提交并且不能回滚。如果运行 DDL 的时候,正在一个事务的中间过程中,会先自动提交当前事务,再执行 DDL。
TiDB 只支持 SNAPSHOT ISOLATION
,可以通过下面的语句将当前 Session 的隔离级别设置为 READ COMMITTED
,这只是语法上的兼容,事务依旧是以 SNAPSHOT ISOLATION
来执行。
{{< copyable "sql" >}}
SET SESSION TRANSACTION ISOLATION LEVEL READ COMMITTED;
TiDB 中,对于普通的 INSERT
语句写入的值,会进行惰性检查。惰性检查的含义是,不在 INSERT
语句执行时进行唯一约束的检查,而在事务提交时进行唯一约束的检查。
举例:
{{< copyable "sql" >}}
CREATE TABLE T (I INT KEY);
INSERT INTO T VALUES (1);
BEGIN;
INSERT INTO T VALUES (1); -- MySQL 返回错误;TiDB 返回成功
INSERT INTO T VALUES (2);
COMMIT; -- MySQL 提交成功;TiDB 返回错误,事务回滚
SELECT * FROM T; -- MySQL 返回 1 2;TiDB 返回 1
惰性检查的意义在于,如果对事务中每个 INSERT
语句都立刻进行唯一性约束检查,将造成很高的网络开销。而在提交时进行一次批量检查,将会大幅提升性能。
注意:
本优化仅对普通的
INSERT
语句生效,对INSERT IGNORE
和INSERT ON DUPLICATE KEY UPDATE
不会生效。
TiDB 支持语句执行的原子性回滚。在事务内部执行一个语句,遇到错误时,该语句整体不会生效。
{{< copyable "sql" >}}
begin;
insert into test values (1);
insert into tset values (2); -- tset 拼写错误,使该语句执行出错。
insert into test values (3);
commit;
上面的例子里面,第二条语句执行失败,但第一和第三条语句仍然能正常提交。
{{< copyable "sql" >}}
begin;
insert into test values (1);
insert into tset values (2); -- tset 拼写错误,使该语句执行出错。
insert into test values (3);
rollback;
以上例子中,第二条语句执行失败。由于调用了 ROLLBACK
,因此事务不会将任何数据写入数据库。
对于 TiDB 事务而言,事务太大或太小,都会影响事务的执行效率。
以如下 query 为例,当 autocommit = 1
时,下面三条语句各为一个事务:
{{< copyable "sql" >}}
UPDATE my_table SET a ='new_value' WHERE id = 1;
UPDATE my_table SET a ='newer_value' WHERE id = 2;
UPDATE my_table SET a ='newest_value' WHERE id = 3;
此时每一条语句都需要经过两阶段提交,频繁的网络交互致使延迟率高。为提升事务执行效率,可以选择使用显式事务,即在一个事务内执行三条语句。
优化后版本:
{{< copyable "sql" >}}
START TRANSACTION;
UPDATE my_table SET a ='new_value' WHERE id = 1;
UPDATE my_table SET a ='newer_value' WHERE id = 2;
UPDATE my_table SET a ='newest_value' WHERE id = 3;
COMMIT;
同理,执行 INSERT
语句时,建议使用显式事务。
注意:
由于 TiDB 中的资源是分布式的,TiDB 中单线程 workload 可能不会很好地利用分布式资源,因此性能相比于单实例部署的 MySQL 较低。这与 TiDB 中的事务延迟较高的情況类似。
由于底层存储引擎的限制,TiDB 要求单个键值对不超过 6 MB。
由于 TiDB 两阶段提交的要求,修改数据的单个事务过大时会存在以下问题:
- 客户端在提交之前,数据都写在内存中,而数据量过多时易导致 OOM (Out of Memory) 错误。
- 在第一阶段写入数据耗时增加,与其他事务出现写冲突的概率会指数级增长。
- 最终导致事务完成提交的耗时增加。
为了使性能达到最优,建议每 100~500 行写入一个事务。
TiDB 设置了单个事务的键值对的总大小不超过 100 MB,这个默认值可以通过配置文件中的配置项 txn-total-size-limit
进行修改,最大支持到 10GB。实际的单个事务大小限制还取决于用户的内存,执行大事务时 TiDB 进程的内存消耗大约是事务大小 6 倍以上。
在 4.0 以前的版本,TiDB 限制了单个事务的键值对的总数量不超过 30 万条,在 4.0 之后的版本没有这项限制。