カメラ行列(カメラぎょうれつ、英語: camera matrix)または(カメラ)射影行列(とうえいぎょうれつ、英語: projection matrix)はコンピュータビジョンの分野で用いられる3次元空間内の3次元点から画像内の2次元点へのピンホールカメラモデルによる投影を記述する 行列である。
を同次座標(4次元ベクトル)での3次元点の表現とし、 を同次座標(3次元ベクトル)でのピンホールカメラモデルでこの点を投影したときの画像上の点の表現とすると、次の関係が成り立つ
ここで はカメラ行列で、記号 は、左辺と右辺が非ゼロのスカラー倍を許容して等しいことを意味する。
カメラ行列 は2つの射影空間の要素間の写像に関与するため、これも射影要素とみなせる。これは、スカラー倍(ゼロ以外)したカメラ行列も元と等価なカメラ行列になるため、自由度が11しかないことを意味する。
ピンホールカメラモデルによると、3次元点 P の座標から、画像平面への点の投影の2次元画像座標へのマッピングは、次の式で与えられる。
ここでは、カメラ中心座標系に対する P の3次元座標、 は結果となる画像座標、f はカメラの焦点距離で f > 0 と仮定する。また、 x3 > 0 であると仮定する。
カメラ行列を導出するために、上記の式を同次座標で書き直す。2次元ベクトル の代わりに射影要素(3次元ベクトル) を考え、等式の代わりに で示されるゼロ以外の数値によるスケーリングまで許容するような等式を考える。まず、同次画像座標を通常の3次元座標の式として記述する。
最後に、3次元座標も同次表現 で表され、カメラ行列は次のように表される。
- または
ここで はカメラ行列で、ここでは次の式で与えられる。
- 、
そして対応するカメラ行列は次のようになる。
最後のステップは、 自体が射影要素であることの結果である。
ここで導出されたカメラ行列は、ゼロ以外の要素がほとんど含まれていないという意味で自明に見えるかもしれない。これは、3次元点および2次元点に選ばれた特定の座標系に大きく依存する。ただし、実際には、以下に示すように他の形式のカメラ行列が一般的である。
前のセクションで導出されたカメラ行列 には、次のベクトルがまたがる零空間がある。
これは、座標 (0,0,0) を持つ3次元点の同次表現でもある。つまり、「カメラの中心」(入射瞳とも呼ばれるピンホール カメラのピンホールの位置)は O にある。つまり、カメラの中心は(そしてこの点だけが)、カメラによって画像平面内の点にマッピングすることができない(あるいは、画像上のすべての光線はこのポイントを通過するため、画像上のすべての点にマッピングされる)。
の他の3次元点の場合、結果の は well-defined であり、 の形式になる。これは、射影画像平面の無限遠点に対応する(ただし、画像平面がユークリッド平面であるとみなされる場合、対応する交点は存在しない)。
正規化されたカメラ行列と正規化された画像座標
[編集]
f = 1 と仮定すると、上で導出されたカメラ行列をさらに単純化できる。
ここで は 恒等行列である。ここでの 行列 は、 行列と3次元ベクトルの連結に分割されることに注意されたい。カメラ行列 は正準形式(英語: canonical form)と呼ばれることもある。
ここまでで、3次元空間内のすべての点はカメラ中心座標系、つまりカメラ中心(ピンホールカメラのピンホールの位置)に原点を持つ座標系で表される。しかし実際は、3次元点は任意の座標系 (X1', X2', X3') に対する座標として表せる。カメラの座標軸 (X1, X2, X3) とある座標軸 (X1', X2', X3') がユークリッド型(直交かつ等方)であると仮定すると、2つの座標系の間にユークリッド3次元変換(回転と平行移動)が唯一存在する。つまりカメラは原点にあり z 軸方向を見ている必要はないということである。
3次元座標の回転と平行移動という2つの操作は、次の2つの 行列として表せる。
- と
ここで は 回転行列であり、 は3次元並進ベクトルである。1番目の行列が3次元点の同次表現に乗算されると、結果は回転した点の同次表現になり、2番目の行列は同様に平行移動を実行する。2つの操作を順番に、つまり、最初に回転、次に平行移動(回転後の座標系で表された平行移動ベクトルを使用)を実行すると、回転と平行移動を組み合わせた行列が得られる。
と がちょうど上記の2つの座標系 (X1, X2, X3) と (X1', X2', X3') を関係づける回転と平行移動であると仮定すると、これは次のことを意味する。
ここで は座標系 (X1', X2', X3') における点 P の同次表現である。
また、カメラ行列が で与えられると仮定すると (X1, X2, X3) 系の座標から同次画像座標へのマッピングは次のようになる。
したがって、座標系 (X1',X2',X3') の点を画像座標に関連付けるカメラ行列は、次のような3次元回転行列と3次元平行移動ベクトルの連結となる。
このタイプのカメラ行列は正規化されたカメラ行列と呼ばれ、焦点距離 = 1 であり、画像座標は原点が軸 X3 と画像平面の交点に位置し、3次元座標と同じ単位で測定されることを仮定している。結果の画像座標は、正規化された画像座標と呼ばれる。
ここでも、上記の正規化されたカメラ行列 の零空間は、4次元ベクトルによって渡っている。
これもやはりカメラの中心の座標であり、 (X1', X2', X3') 系で表現されている。これは最初に回転を適用し、次に平行移動を3次元ベクトルに適用することで確認できる。結果は、3次元座標 (0,0,0) の同次表現となる。
これは、カメラの中心(同次表現)が、カメラ行列が参照している座標系と同じ座標系を基準とした3次元座標で表現されている場合、カメラ行列の零空間にあることを意味する。
正規化されたカメラ行列 は次のように記述できる。
ここで は (X1',X2',X3') 系に対するカメラの3次元座標である。
正規化されたカメラ行列により生成されたマッピングが与えられると、結果の正規化された画像座標は、任意の2次元ホモグラフィによって変換できる。これには、2次元の平行移動と回転とスケーリング(等方性と異方性)だけでなく、一般的な二次元透視変換も含まれる。このような変換は正規化された同次画像座標 を変換された同次画像座標 にマッピングする 行列 として表せる。
3次元座標に関して正規化された画像座標に上記の式を挿入すると、
こうして、最も一般的な形式のカメラ行列が得られる。
- Richard Hartley and Andrew Zisserman (2003). Multiple View Geometry in computer vision. Cambridge University Press. ISBN 0-521-54051-8