コンテンツにスキップ

英文维基 | 中文维基 | 日文维基 | 草榴社区

「リエントラント」の版間の差分

出典: フリー百科事典『ウィキペディア(Wikipedia)』
削除された内容 追加された内容
m 外部リンク: Template:Weblio廃止のためテンプレート除去、リンク差し替え
 
(10人の利用者による、間の15版が非表示)
1行目: 1行目:
{{複数の問題
'''リエントラント'''(''reentrant''、'''再入可能''')とは、[[プログラム (コンピュータ)|プログラム]]や[[サブルーチン]]が、実行の途中で割り込まれ、その実行完了する前に再び呼び出され実行されても安全だという性質を指す。割り込みは分岐や呼び出しなどの内部的な動きによって生じる場合もあるし、[[割り込み (コンピュータ)|ハードウェア割り込み]]や[[シグナル (ソフトウェア)|シグナル]]などの外部の動きによって生じる場合もある。割り込んで呼び出しが完了すれば、割り込まれた呼び出しが実行を継続できる。
|出典の明記=2019年3月
|正確性=2019年3月
|参照方法=2019年3月
|脚注の不足=2019年3月
}}


'''リエントラント'''({{lang-en-short|reentrant / re-entrant}}、'''再入可能''')および'''リエントランシー'''({{lang-en-short|reentrancy / re-entrancy}}、'''再入可能''')とは、ある[[プログラム (コンピュータ)|プログラム]]や[[サブルーチン]]の実行完了する前に、[[割り込み (コンピュータ)|割り込み]]などにより、同じプログラムやサブルーチンを実行ても安全だという性質を指す。割り込みは分岐や呼び出しなどの内部的な動きによって生じる場合もあるし、[[割り込み (コンピュータ)|ハードウェア割り込み]]や[[シグナル (Unix)|シグナル]]などの外部の動きによって生じる場合もある。割り込実行を完了後に、割り込み前の実行に影響与えずに継続できる。<!-- HACK: 「リエントラント≠スレッドセーフ」であることは確かだが、「リエントラント」という言葉自体は、スレッドセーフを包含する、もっと広義の意味を持つのでは? リエントラントと非同期シグナルセーフを混同しているように見受けられる。 -->
この定義はシングルスレッドのプログラミング環境が起源であり、[[割り込み (コンピュータ)|ハードウェア割り込み]]で割り込まれた制御の流れが[[割り込みハンドラ|割り込みサービスルーチン]] (ISR) に転送されることから生まれた。ISRが使用するサブルーチンは割り込みをきっかけとして実行される可能性があるため、リエントラントでなければならない。OSの[[カーネル]]が使用するサブルーチンの多くは、カーネルで確保済みのリソースを超えられない制限がありリエントラントではない。そのためISRでできることは限られている。例えば、一般にISRから[[ファイルシステム]]にはアクセスできないし、場合によっては[[ヒープ領域]]も確保できない。

この定義はシングルスレッドのプログラミング環境が起源であり、ハードウェア割り込みで割り込まれた制御の流れが[[割り込みハンドラ|割り込みサービスルーチン]] (ISR) に転送されることから生まれた。ISRが使用するサブルーチンは割り込みをきっかけとして実行される可能性があるため、リエントラントでなければならない。OSの[[カーネル]]が使用するサブルーチンの多くは、カーネルで確保済みのリソースを超えられない制限がありリエントラントではない。そのためISRでできることは限られている。例えば、一般にISRから[[ファイルシステム]]にはアクセスできないし、場合によっては[[ヒープ領域]]も確保できない。


直接または間接に[[再帰]]可能なサブルーチンはリエントラントである。しかし、[[グローバル変数]]が処理の流れの中でしか変化しないことを前提としているサブルーチンはリエントラントではない。グローバル変数を更新するサブルーチンが再帰的に呼び出されれば、1回のサブルーチン実行の中でグローバル変数は突然変化することになる。
直接または間接に[[再帰]]可能なサブルーチンはリエントラントである。しかし、[[グローバル変数]]が処理の流れの中でしか変化しないことを前提としているサブルーチンはリエントラントではない。グローバル変数を更新するサブルーチンが再帰的に呼び出されれば、1回のサブルーチン実行の中でグローバル変数は突然変化することになる。


リエントラント性の概念はシングルスレッドの環境に起源があり、マルチスレッド環境での[[スレッドセーフ]]という概念とは異なる。リエントラントなサブルーチンはスレッドセーフにすることもできるが{{Sfn|Kerrisk|2010|p=657}}、リエントラントだというだけであらゆる状況でスレッドセーフと言えるわけではない。逆にスレッドセーフなコードはリエントラントである必要はない(後述の例を参照)。
リエントラント性の概念はシングルスレッドの環境に起源があり、マルチスレッド環境での[[スレッドセーフ]]という概念とは異なる。リエントラントなサブルーチンはスレッドセーフにすることもできるが{{Sfn|Kerrisk|2010|p=657}}<!-- HACK: 「The Linux Programming Interface」のp.657で述べられている「リエントラント」は、SUS/POSIXのリエントラントであり、非同期シグナル安全のことではない。 -->、リエントラントだというだけであらゆる状況でスレッドセーフと言えるわけではない。逆にスレッドセーフなコードはリエントラントである必要はない(後述の例を参照)。


== 例 ==
== 例 ==
次の例の <code>swap()</code> 関数は、リエントラントではない(同時にスレッドセーフでもない)。したがってこれを割り込みサービスルーチン <code>isr()</code> で使用すべきでない。
次の例の <code>swap()</code> 関数は、リエントラントではない(同時にスレッドセーフでもない)。したがってこれを割り込みサービスルーチン <code>isr()</code> で使用すべきでない。


<source lang=c>
<syntaxhighlight lang=c>
int t;
int t;


void swap(int *x, int *y)
void swap(int *x, int *y)
{
{
t = *x;
t = *x;
*x = *y;
*x = *y;
// ここでハード割り込みが起きて isr() が呼び出される可能性がある
// ここでハード割り込みが起きて isr() が呼び出される可能性がある
*y = t;
*y = t;
}
}


void isr()
void isr()
{
{
int x = 1, y = 2;
int x = 1, y = 2;
swap(&x, &y);
swap(&x, &y);
}
}
</syntaxhighlight>
</source>


<code>swap()</code> は <code>t</code> を[[スレッド局所記憶]]にすることでスレッドセーフにできる。しかしそのようにしてもリエントラントにはならず、<code>swap()</code> 実行中に同じスレッドのコンテキストで <code>isr()</code> が呼び出されれば問題を生じる可能性が残っている。
<code>swap()</code> は <code>t</code> を[[スレッド局所記憶]]にすることでスレッドセーフにできる。しかしそのようにしてもリエントラントにはならず、<code>swap()</code> 実行中に同じスレッドのコンテキストで <code>isr()</code> が呼び出されれば問題を生じる可能性が残っている。


次の工夫を加えたswap関数では、実行完了時のグローバルなデータを注意深く一貫性を保つようにしており、完全にリエントラントである。ただし、実行途中のグローバルなデータの一貫性は保証されていないのでスレッドセーフではない。
次の工夫を加えたswap関数では、実行完了時のグローバルなデータを注意深く一貫性を保つようにしており、完全にリエントラントである。ただし、実行途中のグローバルなデータの一貫性は保証されていないのでスレッドセーフではない。また、<code>int</code>型変数の読み出しおよび書き込みが[[不可分操作]](アトミック)である(読み出し処理および書き込み処理はそれぞれ1命令のみで実行され、処理の最中に割り込みが発生しない)ことが前提である<ref>[https://www.ibm.com/developerworks/library/l-reent/index.html Use reentrant functions for safer signal handling | IBM Developer]</ref><ref>[https://www.ibm.com/developerworks/jp/linux/library/l-reent/index.html 安全なシグナル処理のために再入可能ファンクションを使う | IBM Developer]</ref><!-- このIBMのドキュメントでは、「非同期シグナル安全」の意味で「リエントラント」という言葉を使用している。おそらくこれが混乱の元凶と思われる。 -->


<source lang=c>
<syntaxhighlight lang=c>
int t;
int t;


void swap(int *x, int *y)
void swap(int *x, int *y)
{
{
int s;
int s;


s = t; // グローバル変数をセーブ
s = t; // グローバル変数をセーブ
t = *x;
t = *x;
*x = *y;
*x = *y;
// ここでハード割り込みが起きて isr() が呼び出される可能性がある
// ここでハード割り込みが起きて isr() が呼び出される可能性がある
*y = t;
*y = t;
t = s; // グローバル変数をリストア
t = s; // グローバル変数をリストア
}
}


void isr()
void isr()
{
{
int x = 1, y = 2;
int x = 1, y = 2;
swap(&x, &y);
swap(&x, &y);
}
}
</syntaxhighlight><!-- HACK: 上記では t は終始単なる一時領域としてしか使われていないので、わざわざグローバル変数にする意味がまったくない。もっと明確で具体的な目的のある実際的・実践的な例のほうがよい。 -->
</source>

次のswap関数はリエントラントかつスレッドセーフである。
<syntaxhighlight lang=c>
void swap(int *x, int *y)
{
int t;
t = *x;
*x = *y;
// ここでハード割り込みが起きて isr() が呼び出される可能性がある。
*y = t;
}

void isr()
{
int x = 1, y = 2;
swap(&x, &y);
}
</syntaxhighlight>


== 背景 ==
== 背景 ==
リエントラント性と[[冪等]]性は同義ではない。冪等な関数は、何度呼び出したとしても1度だけ呼び出したかのように全く同じ出力を生成する。一般化すれば、共有データを使わず、入力データに基づいて出力データを生成する関数である(ただし、入力や出力はオプション)。共有データはいつでも誰でもアクセスできる。データを誰かが更新し、誰も更新を把握していない場合、そのデータが以前と比べて変化したのかどうかさえ誰にもわからない。冪等性はリエントラント性を包含するが、逆は必ずしも真ではない。
リエントラント性と[[冪等]]性は同義ではない。冪等な関数は、何度呼び出したとしても1度だけ呼び出したかのように全く同じ出力を生成する。一般化すれば、共有データを使わず、入力データに基づいて出力データを生成する関数である(ただし、入力や出力はオプション)。共有データはいつでも誰でもアクセスできる。データを誰かが更新し、誰も更新を把握していない場合、そのデータが以前と比べて変化したのかどうかさえ誰にもわからない。冪等性はリエントラント性を包含するが、逆は必ずしも真ではない。


データには[[変数 (プログラミング)#スコープと寿命|スコープ]]という属性がある。グローバルなデータはあらゆる関数の[[スコープ]]の範囲外にあり、[[変数 (プログラミング)#スコープと寿命|寿命]]は不定である。一方[[ローカル変数|局所的]]なデータは関数が呼び出されるたびに生成され、関数から抜けるときに破棄される。
データには[[変数 (プログラミング)#スコープと生存期間|スコープ]]という属性がある。グローバルなデータはあらゆる関数の[[スコープ (プログラミング)|スコープ]]の範囲外にあり、[[変数 (プログラミング)#スコープと生存期間|寿命]]は不定である。一方[[ローカル変数|局所的]]なデータは関数が呼び出されるたびに生成され、関数から抜けるときに破棄される。


局所的データはルーチン間で共有されず、再入時にも共有されない。したがってリエントラント性を阻害しない。グローバルなデータは任意の関数間で共有でき、あるいは再入時にも共有される。したがってリエントラント性を阻害する。
局所的データはルーチン間で共有されず、再入時にも共有されない。したがってリエントラント性を阻害しない。グローバルなデータは任意の関数間で共有でき、あるいは再入時にも共有される。したがってリエントラント性を阻害する。


リエントラント性は[[スレッドセーフ]]の概念とは異なるが、密接関連。関数が[[スレッドセーフ]]であっても、リエントラントでないことがある。例えば関数全体を[[ミューテックス]]で囲むと、マルチスレッド環境では問題を防げるが、割り込みサービスルーチで使用すると再入時にミューテックスの解放を待ち続けることになる。混乱を避ける鍵は、リエントラントが1つのスレッド実行でも問題になるという点である。リエントラント性は[[マルチタスク]]OSの存在する前からの概念である。
リエントラント性は[[スレッドセーフ]]の概念と類似してるが、完全しいものではない。関数がスレッドセーフであっても、リエントラントでないことがある。例えば関数全体を[[ミューテックス]]で囲むと、再入が発生しない条件下でのマルチスレッド環境では期待通りの挙動になるが、ミューテックス所有中に[[割り込みドラ#割り込みスレッド|スレッドして実装されていない割り込み]]が生じて再入が発生するとミューテックスの解放を待ち続けてデッドロックとなれはミューテックスが割り込まれた処理割り込みサービスルーチンの間で共有されていることが原因である。混乱を避ける鍵は、リエントラントが1つのスレッド実行でも問題になるという点である。リエントラント性は割り込まれた処理が割り込みサービスルーチンの終了まで全く動作できないために問題となる性質であり、[[マルチタスク]]OSの存在する前からの概念である。


== リエントラント性の原則 ==
== リエントラント性の原則 ==
70行目: 95行目:
: しかし、呼び出す度にメモリ上の新たな場所にある機械語コードを実行するなら、コードを書き換えても他の呼び出しには影響せず、両立は不可能ではない。
: しかし、呼び出す度にメモリ上の新たな場所にある機械語コードを実行するなら、コードを書き換えても他の呼び出しには影響せず、両立は不可能ではない。
; リエントラントなコードは、リエントラントでない[[プログラム (コンピュータ)|プログラム]]や[[サブルーチン]]を呼び出さない。
; リエントラントなコードは、リエントラントでない[[プログラム (コンピュータ)|プログラム]]や[[サブルーチン]]を呼び出さない。
: ユーザー/オブジェクト/プロセスに複数レベルの[[優先度付きキュー|優先度]]があることや、[[マルチプロセッシング]]がリエントラントなコードの制御を複雑化させている。リエントラントな設計においては、あらゆるアクセスに絶えず注意することが重要であり、ルーチン内の副作用に注意することが重要である。
: ユーザー/オブジェクト/プロセスに複数レベルの[[優先度付きキュー|優先度]]があることや、[[マルチプロセッシング]]がリエントラントなコードの制御を複雑化させている。リエントラントな設計においては、あらゆるアクセスに絶えず注意することが重要であり、ルーチン内の[[副作用 (プログラム)|副作用]]に注意することが重要である。


== リエントラントな割り込みハンドラ ==
== リエントラントな割り込みハンドラ ==
リエントラントな割り込みハンドラは、割り込み処理中に早期に割り込み可能にする[[割り込みハンドラ]]である。それによって{{仮リンク|割り込みレイテンシ|en|interrupt latency}}が低減される<ref>{{Cite book |url= http://books.google.com/books?id=vdk4ZGRqMskC&pg=PA342&lpg=PA342&dq=%22reentrant+interrupt%22&source=bl&ots=UJDipLhXcK&sig=RX1QIGRXzhbnHUkDdugk3xZNP8A&hl=en&sa=X&oi=book_result&resnum=6&ct=result#PPA342,M1 |title=ARM System Developer's Guide |authors=Andrew N. Sloss, Dominic Symes, Chris Wright, John Rayfield |year=2004 |page=342}}</ref>。一般に割り込みサービスルーチンをプログラミングする際、割り込みハンドラ内でなるべく早期に割り込み可能な状態にすることが推奨される。それによって割り込みを拾い損なうのを防ぎやすくなる<ref>{{Cite book |url= http://www.cs.utah.edu/~regehr/papers/interrupt_chapter.pdf |format=PDF |title=Safe and structured use of interrupts in real-time and embedded software |author=John Regehr |year=2006}}</ref>。
リエントラントな割り込みハンドラは、割り込み処理中に早期に割り込み可能にする[[割り込みハンドラ]]である。それによって{{仮リンク|割り込みレイテンシ|en|interrupt latency}}が低減される<ref>{{Cite book |url= https://books.google.co.jp/books?id=vdk4ZGRqMskC&pg=PA342&lpg=PA342&dq=%22reentrant+interrupt%22&source=bl&ots=UJDipLhXcK&sig=RX1QIGRXzhbnHUkDdugk3xZNP8A&hl=en&sa=X&oi=book_result&ct=result&redir_esc=y#PPA342,M1 |title=ARM System Developer's Guide |authors=Andrew N. Sloss, Dominic Symes, Chris Wright, John Rayfield |year=2004 |page=342}}</ref>。一般に割り込みサービスルーチンをプログラミングする際、割り込みハンドラ内でなるべく早期に割り込み可能な状態にすることが推奨される。それによって割り込みを拾い損なうのを防ぎやすくなる<ref>{{Cite book |url= http://www.cs.utah.edu/~regehr/papers/interrupt_chapter.pdf |format=PDF |title=Safe and structured use of interrupts in real-time and embedded software |author=John Regehr |year=2006}}</ref>。


== さらなる例 ==
== さらなる例 ==
以下のコードにある関数 <code>f</code> も <code>g</code> もリエントラントでは'''ない'''。
以下のコードにある関数 <code>f</code> も <code>g</code> もリエントラントでは'''ない'''。


<source lang="c">
<syntaxhighlight lang="c">
int g_var = 1;
int g_var = 1;


int f()
int f()
{
{
g_var = g_var + 2;
g_var = g_var + 2;
return g_var;
return g_var;
}
}


int g()
int g()
{
{
return f() + 2;
return f() + 2;
}
}
</syntaxhighlight>
</source>


上記のコードで、<code>f</code> はグローバル変数 <code>g_var</code> に依存している。したがって、2つのプロセス(スレッド)が <code>f</code> を実行すると、<code>g_var</code> に同時並行的にアクセスし、結果はタイミングに依存することになる。したがって、<code>f</code> はリエントラントではない。その <code>f</code> を呼び出している <code>g</code> もリエントラントではない。
上記のコードで、<code>f</code> はグローバル変数 <code>g_var</code> に依存している。したがって、2つのプロセス(スレッド)が <code>f</code> を実行すると、<code>g_var</code> に同時並行的にアクセスし、結果はタイミングに依存することになる。したがって、<code>f</code> はリエントラントではない。その <code>f</code> を呼び出している <code>g</code> もリエントラントではない。
97行目: 122行目:
これらを若干変更したリエントラントで'''ある'''版を以下に示す:
これらを若干変更したリエントラントで'''ある'''版を以下に示す:


<source lang="c">
<syntaxhighlight lang="c">
int f(int i)
int f(int i)
{
{
return i + 2;
return i + 2;
}
}


int g(int i)
int g(int i)
{
{
return f(i) + 2;
return f(i) + 2;
}
}
</syntaxhighlight>
</source>


新しい版では、グローバル変数 <code>g_var</code> は使われていない。引数を渡して、それに基づいて処理を行って結果を返す。共有される可能性のあるオブジェクトにはアクセスしないようになっている。その代わり、呼出し側が前回の戻り値を引数として渡してやらなければならない。このように、リエントラントなサブルーチンでは、必要な静的データは呼出し側が管理しなければならない。
新しい版では、グローバル変数 <code>g_var</code> は使われていない。引数を渡して、それに基づいて処理を行って結果を返す。共有される可能性のあるオブジェクトにはアクセスしないようになっている。その代わり、呼出し側が前回の戻り値を引数として渡してやらなければならない。このように、リエントラントなサブルーチンでは、必要な静的データは呼出し側が管理しなければならない。


次の[[C言語]]のコードでは、関数はスレッドセーフだが、リエントラントではない。
次の[[Pthreads]]を使った[[C言語]]のコードでは、関数<code>function</code>はスレッドセーフだが、リエントラント(非同期シグナル安全)ではない。Pthreadsの[[ミューテックス]]関数がリエントラント(非同期シグナル安全)であることは保証されないからである<ref>[https://linuxjm.osdn.jp/html/glibc-linuxthreads/man3/pthread_mutex_lock.3.html Man page of PTHREAD_MUTEX]</ref>


<source lang="c">
<syntaxhighlight lang="c">
int function()
void function(pthread_mutex_t mutex)
{
{
pthread_mutex_lock(mutex);
mutex_lock();
...
/* ... */
/* 何らかの処理 */
function body
...
/* ... */
pthread_mutex_unlock(mutex);
mutex_unlock();
}
}
</syntaxhighlight>
</source>

この <code>function</code> は複数のスレッドから呼び出されても全く問題はないしかし、<code>pthread_mutex_init()</code>による[[ミューテックス]]の初期化時に<code>PTHREAD_MUTEX_NORMAL</code>を設定した属性を使用していて、リエントラントな割り込みハンドラがこの関数を呼び出す場合、2つ目の割り込みがこの関数実行中に発生すると、二度目の呼び出しは[[ミューテックス]]を獲得できず、永久に停止([[デッドロック]])する。割り込みサービスでは他の割り込みをディセーブルするので、システム全体がハングアップすることになる。

デッドロックを回避するには、ミューテックス初期化時に、同一スレッドによる複数回のロックを許可する<code>PTHREAD_MUTEX_RECURSIVE</code>を設定した属性を使用する必要がある<ref>[https://linux.die.net/man/3/pthread_mutexattr_settype pthread_mutexattr_settype(3) - Linux man page]</ref>。ただし、<code>PTHREAD_MUTEX_RECURSIVE</code>を設定したからといって、<code>pthread_mutex_lock()</code>および<code>pthread_mutex_unlock()</code>が非同期シグナル安全になるとは限らない。なお、ミューテックス初期化時に<code>PTHREAD_MUTEX_INITIALIZER</code>を使用すると、<code>PTHREAD_MUTEX_DEFAULT</code>を設定した既定の属性が使用されることになり、デッドロックに関しては未定義動作となる。

一方、[[Microsoft Windows]]の<code>EnterCriticalSection()</code>関数は、同一スレッドからの複数回呼び出しはブロッキングなしで実行される<ref>[https://docs.microsoft.com/en-us/windows/desktop/api/synchapi/nf-synchapi-entercriticalsection EnterCriticalSection function | Microsoft Docs] ''After a thread has ownership of a critical section, it can make additional calls to EnterCriticalSection or TryEnterCriticalSection without blocking its execution. This prevents a thread from deadlocking itself while waiting for a critical section that it already owns.''</ref>。ただし非同期シグナル安全性や再入可能性に関する言及や保証はない。

== POSIXのリエントラントと非同期シグナル安全 ==
[[POSIX]]標準には、"_r" の接尾辞が付けられたC言語関数群が用意されている。これらは従来の[[標準Cライブラリ]]関数のリエントラントバージョンである。規格では、「リエントラント関数」を以下のように定義している<ref>[http://www.unix.org/whitepapers/reentrant.html Thread-safety and POSIX.1]</ref>。

{{Quotation|In POSIX.1c, a "reentrant function" is defined as a "function whose effect, when called by two or more threads, is guaranteed to be as if the threads each executed the function one after another in an undefined order, even if the actual execution is interleaved" (ISO/IEC 9945:1-1996, §2.2.2).}}

: 2つ以上のスレッドから呼ばれたときの結果が、たとえ実際の実行がインターリーブ(交互配置)されたものであったとしても、スレッドがそれぞれ未定義の順序でその関数を次々に実行したかのようであることが保証される関数。

つまり、マルチスレッド環境下での実行順序非依存性や並列実行可能性(スレッドセーフ)の意味でリエントラントという用語を規定しており、非同期シグナル安全性に関しては述べられていない。


一方、POSIXでは非同期シグナル安全な118の関数を規定している。シグナルハンドラ内部では非同期シグナル安全でない関数は呼び出してはいけない<ref>[https://docs.oracle.com/cd/E19120-01/open.solaris/816-5137/gen-26/index.html Signal Handlers and Async-Signal Safety (Multithreaded Programming Guide) | Oracle]</ref><ref>[https://docs.oracle.com/cd/E19683-01/816-3976/gen-26/ シグナルハンドラと「非同期シグナル安全」 (マルチスレッドのプログラミング) | Oracle]</ref>。
この <code>function</code> は複数のスレッドから呼び出されても全く問題はないしかし、リエントラントな割り込みハンドラがこの関数を呼び出す場合、2つ目の割り込みがこの関数実行中に発生すると、二度目の呼び出しは[[ミューテックス]]を獲得できず、永久に停止する。割り込みサービスでは他の割り込みをディセーブルするので、システム全体がハングアップすることになる。


== 脚注 ==
== 脚注 ==
138行目: 178行目:


== 外部リンク ==
== 外部リンク ==
* Article "[http://www-106.ibm.com/developerworks/linux/library/l-reent.html Use reentrant functions for safer signal handling]" by Dipak K Jha
<!--* Article "[http://www-106.ibm.com/developerworks/linux/library/l-reent.html Use reentrant functions for safer signal handling]" by Dipak K Jha--><!-- リンク切れ。 -->
* "[http://publib.boulder.ibm.com/infocenter/aix/v6r1/index.jsp?topic=/com.ibm.aix.genprogc/doc/genprogc/writing_reentrant_thread_safe_code.htm 再入可能コードおよびスレッド・セーフ・コードの作成]," from ''AIX Version 6.1 プログラミングの一般概念: プログラムの作成およびデバッグ''
* "[http://publib.boulder.ibm.com/infocenter/aix/v6r1/index.jsp?topic=/com.ibm.aix.genprogc/doc/genprogc/writing_reentrant_thread_safe_code.htm 再入可能コードおよびスレッド・セーフ・コードの作成]," from ''AIX Version 6.1 プログラミングの一般概念: プログラムの作成およびデバッグ'' {{リンク切れ|date=2019年3月}}
* Jack Ganssle (2001). "[http://www.eetimes.com/discussion/beginner-s-corner/4023308/Introduction-to-Reentrancy Introduction to Reentrancy]". ''EE Times''.
* Jack Ganssle (2001). "[http://www.eetimes.com/discussion/beginner-s-corner/4023308/Introduction-to-Reentrancy Introduction to Reentrancy]". ''EE Times''. {{リンク切れ|date=2019年3月}}
* Raymond Chen (2004). [http://blogs.msdn.com/b/oldnewthing/archive/2004/06/29/168719.aspx The difference between thread-safety and re-entrancy]. ''The Old New Thing''.
* Raymond Chen (2004). [http://blogs.msdn.com/b/oldnewthing/archive/2004/06/29/168719.aspx The difference between thread-safety and re-entrancy]. ''The Old New Thing''.
* {{Kotobank|2=ブリタニカ国際大百科事典 小項目事典}}
* {{Kotobank|2=ブリタニカ国際大百科事典 小項目事典}}

2023年8月24日 (木) 15:55時点における最新版

リエントラント: reentrant / re-entrant再入可能)およびリエントランシー: reentrancy / re-entrancy再入可能性)とは、あるプログラムサブルーチンの実行を完了する前に、割り込みなどにより、同じプログラムやサブルーチンを実行しても安全だという性質を指す。割り込みは分岐や呼び出しなどの内部的な動きによって生じる場合もあるし、ハードウェア割り込みシグナルなどの外部の動きによって生じる場合もある。割り込みの実行を完了後に、割り込み前の実行に影響を与えずに継続できる。

この定義はシングルスレッドのプログラミング環境が起源であり、ハードウェア割り込みで割り込まれた制御の流れが割り込みサービスルーチン (ISR) に転送されることから生まれた。ISRが使用するサブルーチンは割り込みをきっかけとして実行される可能性があるため、リエントラントでなければならない。OSのカーネルが使用するサブルーチンの多くは、カーネルで確保済みのリソースを超えられない制限がありリエントラントではない。そのためISRでできることは限られている。例えば、一般にISRからファイルシステムにはアクセスできないし、場合によってはヒープ領域も確保できない。

直接または間接に再帰可能なサブルーチンはリエントラントである。しかし、グローバル変数が処理の流れの中でしか変化しないことを前提としているサブルーチンはリエントラントではない。グローバル変数を更新するサブルーチンが再帰的に呼び出されれば、1回のサブルーチン実行の中でグローバル変数は突然変化することになる。

リエントラント性の概念はシングルスレッドの環境に起源があり、マルチスレッド環境でのスレッドセーフという概念とは異なる。リエントラントなサブルーチンはスレッドセーフにすることもできるが[1]、リエントラントだというだけであらゆる状況でスレッドセーフと言えるわけではない。逆にスレッドセーフなコードはリエントラントである必要はない(後述の例を参照)。

[編集]

次の例の swap() 関数は、リエントラントではない(同時にスレッドセーフでもない)。したがってこれを割り込みサービスルーチン isr() で使用すべきでない。

int t;

void swap(int *x, int *y)
{
  t = *x;
  *x = *y;
  // ここでハード割り込みが起きて isr() が呼び出される可能性がある。
  *y = t;
}

void isr()
{
  int x = 1, y = 2;
  swap(&x, &y);
}

swap()tスレッド局所記憶にすることでスレッドセーフにできる。しかしそのようにしてもリエントラントにはならず、swap() 実行中に同じスレッドのコンテキストで isr() が呼び出されれば問題を生じる可能性が残っている。

次の工夫を加えたswap関数では、実行完了時のグローバルなデータを注意深く一貫性を保つようにしており、完全にリエントラントである。ただし、実行途中のグローバルなデータの一貫性は保証されていないのでスレッドセーフではない。また、int型変数の読み出しおよび書き込みが不可分操作(アトミック)である(読み出し処理および書き込み処理はそれぞれ1命令のみで実行され、処理の最中に割り込みが発生しない)ことが前提である[2][3]

int t;

void swap(int *x, int *y)
{
  int s;

  s = t; // グローバル変数をセーブ
  t = *x;
  *x = *y;
  // ここでハード割り込みが起きて isr() が呼び出される可能性がある。
  *y = t;
  t = s; // グローバル変数をリストア
}

void isr()
{
  int x = 1, y = 2;
  swap(&x, &y);
}

次のswap関数はリエントラントかつスレッドセーフである。

void swap(int *x, int *y)
{
  int t;
  t = *x;
  *x = *y;
  // ここでハード割り込みが起きて isr() が呼び出される可能性がある。
  *y = t;
}

void isr()
{
  int x = 1, y = 2;
  swap(&x, &y);
}

背景

[編集]

リエントラント性と冪等性は同義ではない。冪等な関数は、何度呼び出したとしても1度だけ呼び出したかのように全く同じ出力を生成する。一般化すれば、共有データを使わず、入力データに基づいて出力データを生成する関数である(ただし、入力や出力はオプション)。共有データはいつでも誰でもアクセスできる。データを誰かが更新し、誰も更新を把握していない場合、そのデータが以前と比べて変化したのかどうかさえ誰にもわからない。冪等性はリエントラント性を包含するが、逆は必ずしも真ではない。

データにはスコープという属性がある。グローバルなデータはあらゆる関数のスコープの範囲外にあり、寿命は不定である。一方局所的なデータは関数が呼び出されるたびに生成され、関数から抜けるときに破棄される。

局所的データはルーチン間で共有されず、再入時にも共有されない。したがってリエントラント性を阻害しない。グローバルなデータは任意の関数間で共有でき、あるいは再入時にも共有される。したがってリエントラント性を阻害する。

リエントラント性はスレッドセーフの概念と類似してはいるが、完全に等しいものではない。関数がスレッドセーフであっても、リエントラントでないことがある。例えば関数全体をミューテックスで囲むと、再入が発生しない条件下でのマルチスレッド環境では期待通りの挙動になるが、ミューテックス所有中にスレッドとして実装されていない割り込みが生じて再入が発生するとミューテックスの解放を待ち続けてデッドロックとなる。これはミューテックスが割り込まれた処理と割り込みサービスルーチンの間で共有されていることが原因である。混乱を避ける鍵は、リエントラントが1つのスレッド実行でも問題になるという点である。リエントラント性は割り込まれた処理が割り込みサービスルーチンの終了まで全く動作できないために問題となる性質であり、マルチタスクOSの存在する前からの概念である。

リエントラント性の原則

[編集]
リエントラントなコードは、静的変数やグローバル変数を保持しない。
リエントラントな関数はグローバルなデータを使えないわけではない。例えばリエントラントな割り込みサービスルーチンは、(例えば、シリアルポートのバッファを読み取るなど)ハードウェアのステータス情報を取得できるが、それはグローバルなデータであると同時に揮発性である。それでも静的変数やグローバルなデータを普通に使うことは勧められず、不可分なリード・モディファイ・ライト命令を使ってそのような変数にアクセスするべきである(そのような不可分命令を実行中は割り込みやシグナルが処理を中断できない)。
リエントラントなコードは自分のコードを書き換えない。
OSによってはプロセスが自身のコードを書きかえることを許している。その理由は様々だが(例えば、BitBltでグラフィックスを高速化するためなど)、呼び出す度にコードが変化している可能性があるなら、リエントラント性との両立は難しい。
しかし、呼び出す度にメモリ上の新たな場所にある機械語コードを実行するなら、コードを書き換えても他の呼び出しには影響せず、両立は不可能ではない。
リエントラントなコードは、リエントラントでないプログラムサブルーチンを呼び出さない。
ユーザー/オブジェクト/プロセスに複数レベルの優先度があることや、マルチプロセッシングがリエントラントなコードの制御を複雑化させている。リエントラントな設計においては、あらゆるアクセスに絶えず注意することが重要であり、ルーチン内の副作用に注意することが重要である。

リエントラントな割り込みハンドラ

[編集]

リエントラントな割り込みハンドラは、割り込み処理中に早期に割り込み可能にする割り込みハンドラである。それによって割り込みレイテンシ英語版が低減される[4]。一般に割り込みサービスルーチンをプログラミングする際、割り込みハンドラ内でなるべく早期に割り込み可能な状態にすることが推奨される。それによって割り込みを拾い損なうのを防ぎやすくなる[5]

さらなる例

[編集]

以下のコードにある関数 fg もリエントラントではない

int g_var = 1;

int f()
{
  g_var = g_var + 2;
  return g_var;
}

int g()
{
  return f() + 2;
}

上記のコードで、f はグローバル変数 g_var に依存している。したがって、2つのプロセス(スレッド)が f を実行すると、g_var に同時並行的にアクセスし、結果はタイミングに依存することになる。したがって、f はリエントラントではない。その f を呼び出している g もリエントラントではない。

これらを若干変更したリエントラントである版を以下に示す:

int f(int i)
{
  return i + 2;
}

int g(int i)
{
  return f(i) + 2;
}

新しい版では、グローバル変数 g_var は使われていない。引数を渡して、それに基づいて処理を行って結果を返す。共有される可能性のあるオブジェクトにはアクセスしないようになっている。その代わり、呼出し側が前回の戻り値を引数として渡してやらなければならない。このように、リエントラントなサブルーチンでは、必要な静的データは呼出し側が管理しなければならない。

次のPthreadsを使ったC言語のコードでは、関数functionはスレッドセーフだが、リエントラント(非同期シグナル安全)ではない。Pthreadsのミューテックス関数がリエントラント(非同期シグナル安全)であることは保証されないからである[6]

void function(pthread_mutex_t mutex)
{
  pthread_mutex_lock(mutex);
  /* ... */
  /* 何らかの処理 */
  /* ... */
  pthread_mutex_unlock(mutex);
}

この function は複数のスレッドから呼び出されても全く問題はない。しかし、pthread_mutex_init()によるミューテックスの初期化時にPTHREAD_MUTEX_NORMALを設定した属性を使用していて、リエントラントな割り込みハンドラがこの関数を呼び出す場合、2つ目の割り込みがこの関数実行中に発生すると、二度目の呼び出しはミューテックスを獲得できず、永久に停止(デッドロック)する。割り込みサービスでは他の割り込みをディセーブルするので、システム全体がハングアップすることになる。

デッドロックを回避するには、ミューテックス初期化時に、同一スレッドによる複数回のロックを許可するPTHREAD_MUTEX_RECURSIVEを設定した属性を使用する必要がある[7]。ただし、PTHREAD_MUTEX_RECURSIVEを設定したからといって、pthread_mutex_lock()およびpthread_mutex_unlock()が非同期シグナル安全になるとは限らない。なお、ミューテックス初期化時にPTHREAD_MUTEX_INITIALIZERを使用すると、PTHREAD_MUTEX_DEFAULTを設定した既定の属性が使用されることになり、デッドロックに関しては未定義動作となる。

一方、Microsoft WindowsEnterCriticalSection()関数は、同一スレッドからの複数回呼び出しはブロッキングなしで実行される[8]。ただし非同期シグナル安全性や再入可能性に関する言及や保証はない。

POSIXのリエントラントと非同期シグナル安全

[編集]

POSIX標準には、"_r" の接尾辞が付けられたC言語関数群が用意されている。これらは従来の標準Cライブラリ関数のリエントラントバージョンである。規格では、「リエントラント関数」を以下のように定義している[9]

In POSIX.1c, a "reentrant function" is defined as a "function whose effect, when called by two or more threads, is guaranteed to be as if the threads each executed the function one after another in an undefined order, even if the actual execution is interleaved" (ISO/IEC 9945:1-1996, §2.2.2).
2つ以上のスレッドから呼ばれたときの結果が、たとえ実際の実行がインターリーブ(交互配置)されたものであったとしても、スレッドがそれぞれ未定義の順序でその関数を次々に実行したかのようであることが保証される関数。

つまり、マルチスレッド環境下での実行順序非依存性や並列実行可能性(スレッドセーフ)の意味でリエントラントという用語を規定しており、非同期シグナル安全性に関しては述べられていない。

一方、POSIXでは非同期シグナル安全な118の関数を規定している。シグナルハンドラ内部では非同期シグナル安全でない関数は呼び出してはいけない[10][11]

脚注

[編集]

参考文献

[編集]
  • Kerrisk, Michael (2010). The Linux Programming Interface. No Starch Press 

関連項目

[編集]

外部リンク

[編集]