「関係演算子」の版間の差分
等価判定の浅い、深いについて記述を変更 |
|||
5行目: | 5行目: | ||
関係演算子を含む[[式 (プログラミング)|式]]は、'''関係式''' (''relational expression'') または'''条件''' (''condition'') と呼ばれる。また、技術的な文献において、関係を言葉で説明する代わりに関係演算子が用いられることもある。多くのプログラミング言語では、関係演算子は[[中置記法]]で記述される。たとえば、以下のC言語のコードは、''x'' が ''y'' より小さい場合にメッセージを表示するものである。 |
関係演算子を含む[[式 (プログラミング)|式]]は、'''関係式''' (''relational expression'') または'''条件''' (''condition'') と呼ばれる。また、技術的な文献において、関係を言葉で説明する代わりに関係演算子が用いられることもある。多くのプログラミング言語では、関係演算子は[[中置記法]]で記述される。たとえば、以下のC言語のコードは、''x'' が ''y'' より小さい場合にメッセージを表示するものである。 |
||
< |
<syntaxhighlight lang="c"> |
||
if (x < y) { |
if (x < y) { |
||
printf("x is less than y in this example\n"); |
printf("x is less than y in this example\n"); |
||
} |
} |
||
</syntaxhighlight> |
|||
</source> |
|||
他方で[[ポーランド記法|前置記法]]を採用している言語もある。たとえば、[[LISP|Lisp]]では以下のように書く。しかしこれは演算子というよりも、Lispでは[[識別子]]に使える文字の範囲が緩くて、単に <code>>=</code> という名前の関数であるというだけである。 |
他方で[[ポーランド記法|前置記法]]を採用している言語もある。たとえば、[[LISP|Lisp]]では以下のように書く。しかしこれは演算子というよりも、Lispでは[[識別子]]に使える文字の範囲が緩くて、単に <code>>=</code> という名前の関数であるというだけである。 |
||
< |
<syntaxhighlight lang="lisp"> |
||
(if (>= x y) |
(if (>= x y) |
||
(display "x is greater than or equal to y in this example")) |
(display "x is greater than or equal to y in this example")) |
||
</syntaxhighlight> |
|||
</source> |
|||
== 標準的な関係演算子 == |
== 標準的な関係演算子 == |
||
158行目: | 158行目: | ||
これらのC言語ファミリーにおける <code>=</code> の用法は[[バグ]]の温床になりうる。C言語にはブーリアン型がなく、[[if文]]や[[while文]]の条件式には真偽値に評価されうる任意の数値型の式を受け付ける(ゼロあるいはゼロ相当を偽、非ゼロを真とする)。またC言語における代入は文ではなく式であり値を持つ。そのため、プログラマーが <code>if (x == y)</code> の代わりに、<code>if (x = y)</code> とミスタイプしても構文的には合法となってしまうのである。C言語において、<code>if (x == y)</code> は大雑把に言えば「''x'' と ''y'' が等しければ後続の文を実行せよ」を意味する。しかし、<code>if (x = y)</code> とミスタイプすると「''x'' に ''y'' の値を割り当て、もし ''x'' の新しい値が0でなければ、後続の文を実行せよ」という意味になってしまう。たとえば、下記の例で <code>if (x = y)</code> と書いてしまうと、''y'' が ''x'' に代入され両方とも2になり、更に ''x'' の値2は0ではないので、常に if 文のブロックが実行される。したがって、以下のコードは "x is 2 and y is 2" を出力する<ref name="kandr">{{cite book|title=The C Programming Language|last=Kernighan|first=Brian|coauthors=Dennis Ritchie|publisher=Prentice Hall|origyear=1978|year=1988| edition=Second edition}}, 19</ref>。 |
これらのC言語ファミリーにおける <code>=</code> の用法は[[バグ]]の温床になりうる。C言語にはブーリアン型がなく、[[if文]]や[[while文]]の条件式には真偽値に評価されうる任意の数値型の式を受け付ける(ゼロあるいはゼロ相当を偽、非ゼロを真とする)。またC言語における代入は文ではなく式であり値を持つ。そのため、プログラマーが <code>if (x == y)</code> の代わりに、<code>if (x = y)</code> とミスタイプしても構文的には合法となってしまうのである。C言語において、<code>if (x == y)</code> は大雑把に言えば「''x'' と ''y'' が等しければ後続の文を実行せよ」を意味する。しかし、<code>if (x = y)</code> とミスタイプすると「''x'' に ''y'' の値を割り当て、もし ''x'' の新しい値が0でなければ、後続の文を実行せよ」という意味になってしまう。たとえば、下記の例で <code>if (x = y)</code> と書いてしまうと、''y'' が ''x'' に代入され両方とも2になり、更に ''x'' の値2は0ではないので、常に if 文のブロックが実行される。したがって、以下のコードは "x is 2 and y is 2" を出力する<ref name="kandr">{{cite book|title=The C Programming Language|last=Kernighan|first=Brian|coauthors=Dennis Ritchie|publisher=Prentice Hall|origyear=1978|year=1988| edition=Second edition}}, 19</ref>。 |
||
< |
<syntaxhighlight lang="c"> |
||
int x = 1; |
int x = 1; |
||
int y = 2; |
int y = 2; |
||
165行目: | 165行目: | ||
printf("x is %d and y is %d\n", x, y); |
printf("x is %d and y is %d\n", x, y); |
||
} |
} |
||
</syntaxhighlight> |
|||
</source> |
|||
他の言語やコンパイラの中には、このようなミスを事前に防ぐように工夫されているものもある。 |
他の言語やコンパイラの中には、このようなミスを事前に防ぐように工夫されているものもある。 |
||
175行目: | 175行目: | ||
また、プログラマーの中には予防策として、定数に対する比較を記述するとき、以下のように直感とは逆の順でオペランドを記述する者もいる。このようにしておけば、誤って <code>=</code> と書くと 2 は左辺値ではないので、書いたコードは不正になる。コンパイラはこれに対してエラーメッセージを出すので、結果、適切な演算子に修正できるのである。このコーディングスタイルは[[ヨーダ記法]]や left-hand comparison として知られている。ただしこの記法には、比較対象の少なくとも片方が左辺値を持たないような場合にしか使えない、多くの場合は重要な側の式が後から現れることになる、といった欠点がある。 |
また、プログラマーの中には予防策として、定数に対する比較を記述するとき、以下のように直感とは逆の順でオペランドを記述する者もいる。このようにしておけば、誤って <code>=</code> と書くと 2 は左辺値ではないので、書いたコードは不正になる。コンパイラはこれに対してエラーメッセージを出すので、結果、適切な演算子に修正できるのである。このコーディングスタイルは[[ヨーダ記法]]や left-hand comparison として知られている。ただしこの記法には、比較対象の少なくとも片方が左辺値を持たないような場合にしか使えない、多くの場合は重要な側の式が後から現れることになる、といった欠点がある。 |
||
< |
<syntaxhighlight lang="c"> |
||
if (2 == a) { /* 仮に = と == を誤用した場合はコンパイルエラーを引き起こす */ |
if (2 == a) { /* 仮に = と == を誤用した場合はコンパイルエラーを引き起こす */ |
||
/* ... */ |
/* ... */ |
||
} |
} |
||
</syntaxhighlight> |
|||
</source> |
|||
==== PHP での拡張 ==== |
==== PHP での拡張 ==== |
2020年7月5日 (日) 23:03時点における版
計算機科学において、関係演算子(かんけいえんざんし、relational operator)または比較演算子(ひかくえんざんし、comparison operator)とは、プログラミング言語の演算子で、2つの対象の関係を調べるものをいう。たとえば、同値関係を調べる等号( の )や、順序関係を調べる不等号( の )などが含まれる。
JavaやC#など、独立したブーリアン型を型システムに持つ言語では、関係演算子は2つのオペランドの間に演算子が表す関係が成り立つかどうかによって真 (true) または偽 (false) を返す。一方で、C言語などのブーリアン型を持たない初期の言語では、関係演算子は整数 0(偽を意味する)または 1(真を意味する)を返す。
関係演算子を含む式は、関係式 (relational expression) または条件 (condition) と呼ばれる。また、技術的な文献において、関係を言葉で説明する代わりに関係演算子が用いられることもある。多くのプログラミング言語では、関係演算子は中置記法で記述される。たとえば、以下のC言語のコードは、x が y より小さい場合にメッセージを表示するものである。
if (x < y) {
printf("x is less than y in this example\n");
}
他方で前置記法を採用している言語もある。たとえば、Lispでは以下のように書く。しかしこれは演算子というよりも、Lispでは識別子に使える文字の範囲が緩くて、単に >=
という名前の関数であるというだけである。
(if (>= x y)
(display "x is greater than or equal to y in this example"))
標準的な関係演算子
多くのプログラミング言語で使用されている標準的な数値比較演算子を以下に示す。
様式 | 等しい | 等しくない | より大きい | より小さい | 以上 | 以下 |
---|---|---|---|---|---|---|
数学 | ||||||
Fortran[note 1] | .EQ.
|
.NE.
|
.GT.
|
.LT.
|
.GE.
|
.LE.
|
ALGOL 68[note 2] | =
|
≠
|
>
|
<
|
≥
|
≤
|
/=
|
>=
|
<=
| ||||
eq
|
ne
|
gt
|
lt
|
ge
|
le
| |
BASICライク[note 3] | =
|
<>
|
>
|
<
|
>=
|
<=
|
MUMPS | =
|
'=
|
>
|
<
|
'<
|
'>
|
Pascalライク[note 4] | =
|
<>
|
>
|
<
|
>=
|
<=
|
C言語ライク[note 5] | ==
|
!=
|
>
|
<
|
>=
|
<=
|
shライクなシェル[note 6] | -eq
|
-ne
|
-gt
|
-lt
|
-ge
|
-le
|
バッチファイル | EQU
|
NEQ
|
GTR
|
LSS
|
GEQ
|
LEQ
|
MATLAB[note 7] | ==
|
~=
|
>
|
<
|
>=
|
<=
|
eq(x,y)
|
ne(x,y)
|
gt(x,y)
|
lt(x,y)
|
ge(x,y)
|
le(x,y)
| |
Mathematica[1] | ==
|
!=
|
>
|
<
|
>=
|
<=
|
Equal[x,y]
|
Unequal[x,y]
|
Greater[x,y]
|
Less[x,y]
|
GreaterEqual[x,y]
|
LessEqual[x,y]
|
- ^ Fortran 90からはC言語ライクな比較演算子もサポートされている。
- ^ ALGOL 68: "stropping" regimes are used in code on platforms with limited character sets (e.g. use
>=
orGE
instead of≥
), platforms with nobold
emphasis (use'ge'
), or platforms with only UPPERCASE (use.GE
or'GE'
). - ^ Visual Basic、VB.NET、OCaml、SQL、Standard MLなど。
- ^ Simula、Modula-2、Object Pascal、Delphi、Ada、Oberon、OCaml、Standard MLなど。
- ^ C、C++、C#、Go、Java、JavaScript、Perl(文字列比較演算子は別に用意されている)、PHP、Python、Ruby、Rなど。
- ^ sh、bash、ksh、Windows PowerShellなど。
<
と>
はシェルではリダイレクトの記号として用いられるため別の記号を用いる必要がある。先頭のハイフンを除いたものはPerlでは文字列比較演算子として使用される。 - ^ MATLABはC言語ライクな比較演算子を提供するが、
!=
を用いない。MATLABにおいて、!
はシェルコマンドの記述に用いられるからである。上段の形式はSmalltalkでも用いられるが、等号は=
となる。
等号
代入演算子との混乱
C言語から直接または間接的に派生したプログラミング言語では、同値関係の関係演算子として、直感的な =
ではなく ==
を用いる。一方、=
を用いる言語としては Pascal、BASIC、Ada、Standard ML、Objective Caml、SQL、VHDL などがある。
C言語は広範囲に普及したため、後発のプログラミング言語における構文や仕様はC言語のそれを参考に定義されたものも多いが、そのうちの一つがこの ==
演算子である。この独特の構文は、B言語開発の初期の段階で =
を別の意味に割り当てたことに端を発する。ALGOLとFORTRANの流れを汲むB言語の設計者は、タイピングを減らしたいという要望から、頻繁に記述される更新・代入操作のためのコピー演算子として =
を代用することを決定したのである (これは A = A + 1
のような、一見して「数学的には不成立」な式が許容されることを意味する)。代わりに、=
が本来担う役割である等号として ==
が使われることとなった。C言語はこれらの演算子をそのまま引き継ぎ、以後 Java や C# をはじめとする多くの言語がこの構文を採用したのである。
これらのC言語ファミリーにおける =
の用法はバグの温床になりうる。C言語にはブーリアン型がなく、if文やwhile文の条件式には真偽値に評価されうる任意の数値型の式を受け付ける(ゼロあるいはゼロ相当を偽、非ゼロを真とする)。またC言語における代入は文ではなく式であり値を持つ。そのため、プログラマーが if (x == y)
の代わりに、if (x = y)
とミスタイプしても構文的には合法となってしまうのである。C言語において、if (x == y)
は大雑把に言えば「x と y が等しければ後続の文を実行せよ」を意味する。しかし、if (x = y)
とミスタイプすると「x に y の値を割り当て、もし x の新しい値が0でなければ、後続の文を実行せよ」という意味になってしまう。たとえば、下記の例で if (x = y)
と書いてしまうと、y が x に代入され両方とも2になり、更に x の値2は0ではないので、常に if 文のブロックが実行される。したがって、以下のコードは "x is 2 and y is 2" を出力する[2]。
int x = 1;
int y = 2;
if (x = y) {
/* yが0でなければ以下のコードは常に実行される */
printf("x is %d and y is %d\n", x, y);
}
他の言語やコンパイラの中には、このようなミスを事前に防ぐように工夫されているものもある。
- 同じ演算子を持つ Java や C# も同様の問題を孕んでいるが、これらの言語ではこの種の誤りは、ほとんどの場合コンパイルエラーとして検出できる。if文やwhile文などの条件式はブーリアン型に制約され、またほかの型(例えば整数型)からブーリアン型に暗黙的に変換されることもないからである(ただしJavaの
java.lang.Boolean
はboolean
に暗黙変換される)。 - gccなどのいくつかのコンパイラでは、if の条件式中に代入演算子を含んでいるコード(意図的に書かれることもある)をコンパイルするときに警告を出す。
- Ada と Python においては、(if 節も含めて)式の途中に代入演算子は登場できないので、この種の誤りは排除できる。
- 同様に BASIC などのいくつかの言語では、文脈に応じて構文的に弁別できることから、代入と等式の両方に
=
記号を使用する(BASIC系では代入は式ではなく文であり、Ada や Python と同様に、代入演算子は式中に出現することがない(そもそも代入演算子が無い、と表現したほうが正確))。
また、プログラマーの中には予防策として、定数に対する比較を記述するとき、以下のように直感とは逆の順でオペランドを記述する者もいる。このようにしておけば、誤って =
と書くと 2 は左辺値ではないので、書いたコードは不正になる。コンパイラはこれに対してエラーメッセージを出すので、結果、適切な演算子に修正できるのである。このコーディングスタイルはヨーダ記法や left-hand comparison として知られている。ただしこの記法には、比較対象の少なくとも片方が左辺値を持たないような場合にしか使えない、多くの場合は重要な側の式が後から現れることになる、といった欠点がある。
if (2 == a) { /* 仮に = と == を誤用した場合はコンパイルエラーを引き起こす */
/* ... */
}
PHP での拡張
PHPでは、==
演算子をさらに拡張し、型が異なっても値が等しければ真を返す ==
演算子(たとえば 4 == "4"
は真である)と、値が等しくかつ同じ型を持っている場合に真を返す ===
演算子(たとえば 4 === 4
は真であるが 4 === "4"
は偽である)の2種類の演算子を持っている[3]。x == 0
は x が 0
、"0"
(文字 0 を含む文字列)または false
(PHPでは他の言語でも見られるように、false
は 0
と等しい)のときに真を返す。これは、変数に 0 の値が割り当てられているかを確認するのに便利であるが、必ずしも期待される動作とは限らない[3]。一方で、x === 0
は x が 0
のときのみ真を返す。
オブジェクトの同一性と内容の等価性
多くの現代的なプログラミング言語において、オブジェクトやデータ構造は参照を通じてアクセスされる。そのような言語では、2種類の異なる等価性を判定する必要性が生じる:
- 物理的な等価 - 2つの参照が同じオブジェクトを参照しているかどうか
- 構造的な等価 - 2つの参照が参照するオブジェクトがある意味において(たとえば内容が同じであるなど)等しいかどうか
- 浅い等価判定(対象オブジェクトの持つ各メンバについて等価性を判定する)
- 深い等価判定(対象オブジェクトの持つ各メンバに加えて、対象オブジェクトから参照できる全てのオブジェクト各メンバについても等価性を判定する)
通常、前者の等価性は後者の等価性を含意しているが(自身に等しくないような NaN のようなものは除く)、逆は必ずしも真ではない。たとえば、2つの文字列オブジェクトは別個のオブジェクトであるかもしれない(前者の意味では等しくない)が、同じ文字の並びを持ちうる(後者の意味で等しい)。
次の表では、これらの2種類の等価性を判定するための異なる方法を、様々な言語において一覧できるようにしてある。
言語 | 物理的な等価 | 構造的な等価 | 備考 |
---|---|---|---|
C, C++ | a == b |
*a == *b |
a とb はポインタである
|
C# | object.ReferenceEquals(a, b) 1 |
a.Equals(b) 1 |
|
Common Lisp | (eq a b) |
(equal a b) |
|
Java | a == b |
a.equals(b) |
a とb は参照である
|
OCaml | a == b |
a = b |
|
Pascal | a^ = b^ |
a = b |
|
Perl | $a == $b |
$$a == $$b |
$a と$b はスカラーリファレンスである
|
PHP5 | N/A | $a == $b |
$a と$b はオブジェクトである
|
Python | a is b |
a == b |
|
Ruby | a.equal?(b) |
a == b |
|
Scheme | (eq? a b) |
(equal? a b) |
|
VB.NET | a Is b |
a = b |
|
Objective-C | a == b |
[a isEqual:b] |
a とb はオブジェクトへのポインタである
|
- 1 C# では、参照型に対する
==
演算子は既定でReferenceEquals()
メソッドの呼び出しと等価になるが、代わりにEquals()
メソッドを実行するように演算子オーバーロードをすることができる。このことによって、構造的な等価性の方がより直感的と思われる型において、==
で構造的な等価性を判定するようにできる。特に文字列比較において、このことが効果的である(Java で文字列比較はa.equals(b)
と書かなければならないが、C# ではa == b
と書ける)。
論理的同値性
一見して自明ではないが、比較演算子は、互いにほかの比較演算子を用いて論理的に同値な命題を構成できる。これは、ちょうどブール論理の論理演算子 XOR、AND、OR、NOT の間で見られる関係に似ている。以下の4つの条件式は互いに論理的同値である。
さらに、等号も不等号を用いて表現することができる。
この性質をプログラミングに応用して、不等号 ≥ だけ(または、≥ と = の二つだけ)を真面目に実装し、ほかの比較演算子を ≥(または、≥ と =)を用いて定義することも行われる。
関連項目
出典
- ^ 関係演算子と論理演算子—Wolfram Mathematica 9 ドキュメント
- ^ Kernighan, Brian; Dennis Ritchie (1988) [1978]. The C Programming Language (Second edition ed.). Prentice Hall, 19
- ^ a b “PHP: Comparison Operators - Manual”. 2008年7月31日閲覧。