コンテンツにスキップ

英文维基 | 中文维基 | 日文维基 | 草榴社区

ノート:ISO-2022-JP

ページのコンテンツが他言語でサポートされていません。

IANAが登録について

[編集]

RFC 2978の

>   A MIBenum value for each charset will be assigned by IANA at the time
>   of registration.  MIBenum values are not assigned by the person
>   registering the charset.

はどう解釈すべきでしょうか。--Emk 2007年1月22日 (月) 22:11 (UTC)[返信]

「IANA に登録」なのか「IANA が登録」なのか、という話ですね。
上記引用を試訳してみると、
各々のキャラクタセットのための MIBenum 値は、登録の時点で IANA によって割り当てされる。MIBenum 値はキャラクタセットを登録する個人によって割り当てされることはない。
ということですね。だから「IANA が登録」というのはおかしい、ということかな?
ただ、この部分は MIBenum (名前としては cs で始まるもの。OID で言うと 1.3.6.1.2.1.43 配下 1.3.6.1.2.1.106) の割り当ての話で、これがキャラクタセット登録に関する作業のすべてではないです。
以下、わたしが「IANA に登録」ではない、と考えるようになった過程を、ほぼそのまま書きます (ので、ちょっと長いです)。
3. Charset Registration Procedure を見ると、「3.1 キャラクタセットのコミュニティへの提示」(だれかがキャラクタセット登録の提案をする)、「3.2 キャラクタセットのレビュー」(提案内容をレビュアが審査する)、「3.3 IANA の登録」(IANA が登録する) となっています。3.3 では、
Provided that the charset registration has either passed review or
has been successfully appealed to the IESG, the IANA will register
the charset, assign a MIBenum value, and make its registration
available to the community.
つまり、登録が有効なものと認められた段階で、「IANA がキャラクタセットを登録し、MIBenum を割り当て、登録をコミュニティで利用可能なものにする」、としています (MIBenum の割り当ては登録そのものではありません)。
この点について、2 つくらい反論ないし疑問がでそうです。
  1. 「IANA に」ではなく「IANA が」登録するのだとすると、登録先はいったいどこなのか。
  2. 登録するのは 2.7 (上記) にあるとおり、提出する個人ではないのか。
1. についてですが、ISO/IEC の国際文字集合登録簿にあたるものとしては、匿名 FTP ファイル character-sets があります。これの URL は RFC 2798RFC 2978 の 4. に明記されていますね。強いて言えば、このファイルが登録先です (が厳密に言えば、このファイルは登録の事実を「公告」しているだけだとも言えます。ISO/IEC の登録簿も同様かもしれませんが、登録先というのは理念上しか存在しないとも考えられます)。
2. についてですが、まず、IANA はインターネットにおける執行機関 (強制力を持った機関) ではない、ということがあります。あくまでも調整活動をする機関であって、たとえば日本政府の内閣のようなものではないです (RFC 2860 も参照)。登録されたキャラクタセットを強制する権限は IANA にはありません。キャラクタセットの登録が尊重される根拠は、インターネットのコミュニティでの合意です。IANA はその合意に基づいて最終的な登録をするだけで、IANA にお願いして登録してもらうわけではないです。
言い換えると、登録は「コミュニティに対して」行われているとも言えます。さらに見方を変えれば、ある個人があるキャラクタセットをインターネット上で利用したいという希望をもったときに、その希望をコミュニティ全体の合意にまで広げるのが、RFC 2798RFC 2978 で提案している手続きだとも言えます (そういう意味では、「個人が登録する」というのも間違いではないでしょう)。いずれにしても、「IANA に登録する」というのは正しくないとおもわれます。
--Hatukanezumi 2007年1月23日 (火) 14:08 (UTC)[返信]
RFC 番号を訂正--Hatukanezumi 2007年1月24日 (水) 13:07 (UTC)[返信]
OID を訂正--Hatukanezumi 2007年1月25日 (木) 15:14 (UTC)[返信]
補足すると、Emk さんの修正は、以上のような意味では正しくないです。IANA は、コミュニティに対して提示されたキャラクタセットの提案が所定の手続きを通過したら、自動的に登録するので、IANA が提案されて登録するのではないです。
--Hatukanezumi 2007年1月23日 (火) 14:39 (UTC)[返信]

CP50220という名称について

[編集]

Windows上で機種依存文字を含んだ独自拡張が使われているのは事実ですが、それはJISまたはISO-2022-JPと称して使われており、CP50220という名称は使われていません。たとえば[1]ではMSDNに出てくると主張していますが、実際にリンク先を確認するとコードページ番号として50220は出てきますが、iso-2022-jpと称していて、名称としてCP50220は使われていません。

またアプリケーションが必ずしもコードページ50220を指定してOSの変換機能を利用しているとは限らず、コードページ932から計算でISO-2022-JPの符号化方式に変換したため結果的にコードページ50220と同様の構成になっている場合もあるようです。

CP50220という名称はiconvやglibcに渡すエンコーディング名称が必要になった都合上、便宜的にレガシーエンコーディングプロジェクト(ないしは森山氏)が考案したものであるようです(が、記事に書けるだけの出典がまだ示せません)。

以上の理由から、CP50220という名称を使わないよう記事を書き換えました。ここにリダイレクトしていたCP50220は、とりあえずMicrosoftコードページ932へのリダイレクトに差し戻しました。--emk 2007年5月31日 (木) 20:33 (UTC)[返信]

「キャクラクタセット」という用語

[編集]

文字コードのことを「キャラクタセット」と称することは、プログラマなどの間での俗称として用いられていたことはありますが、今や百科事典で用いる用語として適切とは考えづらいです。

この用語は、

  • JISやISOの文字コード規格では使われていません
  • IETFやW3Cといった業界団体でも、現在は使用していません
  • 三上喜貴『文字符号の歴史 アジア編』や安岡考一、安岡素子『文字符号の歴史 欧米と日本編』のような学術的な方法で書かれた文献でも使用していません

もし「キャラクタセットと言う用語をみんなが使うべきだ」という主張があるのであれば、それはご自身のウェブサイトなどで展開すべきと思います。 --61.125.217.10 2007年7月14日 (土) 02:16 (UTC)[返信]