Skip to content

Latest commit

 

History

History
404 lines (307 loc) · 17.3 KB

rvalue_ref_and_move_semantics.md

File metadata and controls

404 lines (307 loc) · 17.3 KB

右辺値参照・ムーブセマンティクス

  • cpp11[meta cpp]

概要

ムーブセマンティクスはコピーコストの削減を主な目的としており、また所有権の移動を実現する。
右辺値参照はムーブ元のオブジェクト(右辺値)を束縛するための言語機能である。

右辺値(Rvalues)と左辺値(Lvalues)について

誤解を恐れずに言えば、右辺値とは名前をもたない一時的なオブジェクトである。
また、左辺値とは明示的に実態のある名前付きオブジェクトである。

struct Foo{} ;
int f() { return 0 ; }

int main()
{
  int i = 0;

  i;      // 名前付きオブジェクトは左辺値
  0;      // リテラル値は右辺値

  Foo x ;

  x;      // 名前付きオブジェクトは左辺値
  Foo();  // コンストラクタの戻り値は右辺値

  f();    // 関数の戻り値は右辺値
}

右辺値参照

右辺値参照は、右辺値のみを束縛する参照である。
C++11からは、型Tに対して T& で宣言される参照型を左辺値参照と呼ぶのに対して、T&& で宣言される参照型を右辺値参照と呼ぶ。

C++03までは、右辺値のみを扱う右辺値参照は存在せず、右辺値はconst左辺値参照 const T& に束縛するよう扱われていた。
このconst左辺値参照では左辺値も束縛できるため、左辺値/右辺値の区別情報が失われてしまい、右辺値のみに対して特別な処理を記述することができなかった。

std::vector<int> v, vv;
v = vv;                  // 代入式1
v = std::vector<int>(100, 0); // 代入式2

上記コードはC++03では、代入式1,2ともに右辺は vector<int> const& 型に束縛される。
代入処理の中では、右辺の値をコピーし、左辺の値と置き換えられる。
しかし代入式2の右辺は一時オブジェクトであり、直後に破棄されるため、一時オブジェクトをコピーすることは無駄といえる。
もし右辺値と左辺値を型を用いて区別できれば、右辺値の場合はコピーせず単に左辺と置き換えるといった処理が記述できる。

右辺値参照は、右辺値と左辺値を型として区別するために導入された。
C++11 以降では、代入式2の右辺は右辺値参照 vector<int>&& に束縛されるため、代入演算子オーバーロードにより左辺値参照とは区別して処理される。
また、代入式2で行われる処理のことを「ムーブ」と呼ぶ。

右辺値参照と左辺値参照の挙動をまとめると以下のようになる

int main()
{
  int x = 0;

  // 左辺値参照
  int& lvalue_ref_1 = x;              // OK
  // int& lvalue_ref_2 = 0;           // Error 右辺値を左辺値参照で束縛している

  // 右辺値参照
  // int&& rvalue_ref_1 = x;          // Error 左辺値を右辺値参照で束縛している
  int&& rvalue_ref_2 = 0;             // OK

  // const左辺値参照
  const int& const_lvalue_ref_1 = x;    // OK
  const int& const_lvalue_ref_2 = 0;    // OK const左辺値参照は右辺値を束縛できる
}

右辺値参照で宣言された変数は右辺値ではなく、左辺値である。
右辺値参照であるということと、右辺値であるということは全く違うことである。

int main()
{
  // xの型は int&& である
  // xは左辺値=xは実体を持ち名前のあるオブジェクト
  int&& x = 1;

  // xは左辺値なので右辺値参照できない!
  //int&& y = x; // Error!
}

ムーブ

ムーブとはあるオブジェクトから他のオブジェクトにリソースを明け渡すということである。
値のコピーではコストが高くつく場合は、より高速に値を別の変数へ移すことができる。
リソース明け渡し後のオブジェクトには何が入っているのか不明となり、値を参照した時の動作は対象オブジェクトの型に依存する。 後述する所有権の移動を除けば、一般にはムーブ後オブジェクトの状態は明確に規定されない事が多い。

あるオブジェクトをムーブしたいときには、 std::move()関数を利用する。 ムーブされた変数は右辺値となり、それ以降使える保証はなくなる。
注意すべきことはstd::move()関数の呼び出しは
「このオブジェクトはこれ以降使わないので好きに書き換えて良い」
という明示にすぎない。
実際のムーブは変数をstd::move()関数に通し、後述するムーブコンストラクタ・ムーブ代入演算子に渡した際に行われる。

#include <string>
#include <utility>

int main()
{
  std::string x = "Hello, world!";
  // 何も起こらない
  std::move(x);

  // 実際に x から y へ文字列がムーブされる
  std::string y = std::move(x);
}
  • std::move[link /reference/utility/move.md]

所有権の移動

クラスによってはコピーは禁止されるが、ムーブならば可能ということがある。
そういったクラスではムーブが所有権の移動を表す。
同じものが複数存在してはいけないという制約を持つクラスが所有権の移動に対応しており、ムーブ後の変数は無効値(例えばスマートポインタならnullptr)となることが保証される。
例を挙げると、std::unique_ptrがそれに当たる。 std::unique_ptrはあるオブジェクトの唯一の所有権を持つことを表すスマートポインタである。 所有権は唯一であるので、コピーが禁止されている。 しかし、別の変数にムーブ代入することはできる。

#include <utility>
#include <memory>

int main()
{
  std::unique_ptr<int> p(new int(1));

  // 所有権はqに移り
  // pはnullptrになる
  std::unique_ptr<int> q = std::move(p);
}
  • std::move[link /reference/utility/move.md]

他には、<iostream>も所有権の移動に対応している。

ムーブセマンティクス

ムーブセマンティクスが必要とされる場面として、コピーに高いコストがかかる場合をあげる。
コピーコンストラクタ、コピー代入に高いコストがかかる以下のクラスで説明する。

#include <algorithm>

class large_class
{
private:
  char* ptr ;
public:
  large_class() {
    ptr = new char[1000];
    // バッファに対して、時間のかかる書き込みを実行
  }
  // コピーコンストラクタ
  large_class( const large_class& r ) {
    ptr = new char[1000] ;
    std::copy( r.ptr, r.ptr + 1000, ptr );
  }
  // デストラクタ
  ~large_class() {
    delete[] ptr;
  }
};

int main()
{
  large_class x{};

  // とても時間がかかる
  large_class y(x);
}

コピーには時間がかかる。
コピーをポインタの挿げ替えにしてしまえば、定数時間で処理が終わる。
そうすると元のオブジェクトが参照できなくなる。
しかし、そうなっても良い場合がある。
一時変数からオブジェクトを作る場合などである。

  // 一時変数
  large_class tmp{};

  large_class x(tmp);
  // これ以降tmpは使わない

もう使わない変数とそうでない変数を区別する必要がある。
そこで登場するのが右辺値と右辺値参照である。
右辺値であるということが、変数をムーブしてもよいという意味となる。
右辺値が渡された場合に、ポインタを挿げ替えるため、 右辺値参照を引数にするコンストラクタ・コピー代入演算子(ムーブ演算)を定義する。

ムーブコンストラクタ・ムーブ代入演算子

さきほどのlarge_classにムーブコンストラクタ(右辺値参照を引数とするコンストラクタ)を追加する。
同様にムーブ代入演算子(右辺値参照を引数とする代入演算子)を追加する。

  // ムーブコンストラクタ
  large_class(large_class&& r)
  {
    // ポインタの挿げ替え
    ptr = r.ptr;
    // 元のオブジェクトはnullptrに
    r.ptr = nullptr;
  }
  // ムーブ代入演算子
  large_class& operator=(large_class&& r)
  {
    // 既存バッファの破棄
    delete [] ptr;
    // ポインタの挿げ替え
    ptr = r.ptr;
    // 元のオブジェクトはnullptrに
    r.ptr = nullptr;
    return *this;
  }

左辺値に対してstd::move()を適用すると右辺値となり、ムーブコンストラクタが呼ばれる。

int main()
{
  large_class tmp{};
  large_class y{};

  large_class x(std::move(tmp));   // tmpをムーブしてxを作る
  y = std::move(x);   // x をムーブして y に代入する
}
  • std::move[link /reference/utility/move.md]

標準ライブラリで提供されるクラスのほとんどは、このようなムーブコンストラクタを用意している(mutexatomicなどを除く)。

ムーブコンストラクタ・ムーブ代入演算子は

  • クラスがコピー演算を宣言していない
  • クラスがムーブ演算を宣言していない
  • クラスがデストラクタを宣言していない

の3つを満たす場合のみ自動生成される、特殊メンバ関数である。

また、defaultを指定することができる。

class large_class {
public:
  // ムーブ演算のデフォルト指定
  large_class(large_class&&) = default;
  large_class& operator=(large_class&&) = default;
};

ユニヴァーサル参照

関数テンプレートの型パラメータT型推論プレースホルダautoに参照修飾子&&をつけて宣言したものはユニヴァーサル参照と呼ばれ、通常の右辺値参照とは異なる動作をする。 なお「ユニヴァーサル参照(Universal Reference)」はScott Mayers氏による解説由来の俗称であり、後にC++17仕様において「転送参照(Forwarding Reference)」という正式名称が与えられた。

// ユニヴァーサル参照
template <typename T>
void f(T&& x) {}

関数テンプレートf()のテンプレートパラメータTを用いたT&&はユニヴァーサル参照であり、 f()に渡された実引数が左辺値の場合には左辺値参照となり、右辺値の場合は右辺値参照となる。
これは、次で説明する完全転送に関わる。

完全転送(Perfect Forwarding)

あるが関数が受け取ったパラメータを別の関数へそのまま渡したいとき、 右辺値は右辺値として、左辺値は左辺値として別の関数へ転送したいことがある(完全転送)。
ユニヴァーサル参照を用いると、呼び出し元における右辺値/左辺値という情報が、受け取り側で右辺値参照/左辺値参照という型情報によって区別可能となる。
しかし右辺値を右辺値参照で受け取った場合、その引数をそのまま使うと左辺値になるため再び右辺値へ変換する必要が生じる。

つまり左辺値参照の場合は左辺値として、右辺値参照の場合は右辺値に変換して渡す機能が必要となる。
そのような機能として、std::forward()関数が用意されている。
利用時には std::forward<T>(a) のように、テンプレートパラメータとしてユニヴァーサル参照宣言時の型パラメータ名を明示する必要がある。

#include <utility>

template <typename T> void g(T);

template <typename T>
void f(T&& a)
{
  // 引数 a が左辺値参照の場合は 左辺値 に
  // 右辺値参照の場合は 右辺値 に変換してから
  // 別関数 g() の実引数として渡す。
  g( std::forward<T>(a) ) ;
  // 関数 g() は値型 T としてパラメータを取るため
  // 左辺値ではコピーが、右辺値ではムーブが行われる。
}
  • std::forward[link /reference/utility/forward.md]

仕様

式の分類

右辺値と左辺値は、明快な基準によって2つに分けることが難しい。
厳密な分類は以下のようになっている。

expressionは、 glvaluervalueに分類できる。
glvaluervalueは、
lvaluexvalueprvalueに分類できる。

lvalue
lvalueは関数もしくはオブジェクトを指す。

名前付きの変数が指し示すオブジェクトや、ポインタを通してアクセスできるオブジェクトが該当する。
戻り値の型が左辺値参照型の関数の戻り値などもこれにあたる。

xvalue
xvalueも、オブジェクトを指す。

xvalueのオブジェクトはその寿命が近いか、寿命に関心がないことを表現するために使われる。
xvalueは、一部の式の結果や、rvalueリファレンスへの明示的なキャストなどが該当する。

xvalueの名前の由来は、eXpiring value(期限切れ値)。
xvalueは寿命が近いか、寿命に関心がなく、値を消してしまって問題がないという意味。
オブジェクトがxvalueならば、ムーブしても問題はないことを表現するために使われる。
glvalue
glvalueは、lvalueとxvalueの総称。

glvalueの名前の由来は、generalized lvalue(一般化されたlvalue)。

rvalue
rvalueは、prvalueとxvalueの総称。

xvalueの他には、一時オブジェクトや、リテラル値(10, 3.14, trueなど)や、特定のオブジェクトに関連付けられていない値などが該当する。

prvalue
prvalue(pure rvalue)は、rvalueのうちxvalueではないものである。

一時オブジェクトやリテラル値や、オブジェクトに関連付けされていない値など。
なお、C++17では再定義され、一時オブジェクトではなくなった。 ほかには、関数の戻り値で、型がリファレンスではないものや、
enumの列挙子などもこれにあたる。

この機能が必要になった背景・経緯

ムーブセマンティクスは、C++03でもNRVO(特定の文脈でのコンストラクタの省略)や、 C++11で非推奨となったstd::auto_ptrで実現されていた。
しかし、NRVOがいつでも機能するわけではなかった。
また、std::auto_ptrにはコピーと同じ文法でムーブしていることなど、問題が多かった。
そのため、コピーと区別でき、統一的にムーブを表す文法が言語機能として必要とされた。

関連項目

参照