利用者‐会話:Hatukanezumi/JIS X 0208:1997附属書5の代替名称
いわゆる「半角カナ」の使用は、JIS X 0208:1997 では、附属書1「シフト符号化表現」(いわゆるShift_JIS) でのみ規定されているので、Shift_JISを採用していないウィキペディアでは用いてはならないと解される (なお、シフト符号化表現であっても、同附属書には上記ただし書きがあるので原則として使わない)。
これはウィキペディアがJIS X 0208:1997で規定されている他の符号化のいずれかを採用している場合にのみ成り立つ論法だと思うのですが。知っての通りウィキペディアは漢字用7ビット符号も漢字用8ビット符号も国際基準版・漢字用7ビット符号も国際基準版・漢字用8ビット符号もラテン文字・漢字用7ビット符号もラテン文字・漢字用8ビット符号もRFC1468符号化表現も採用していないので、「JIS X 0208:1997には適合し得ない」という結論にしかならないと思います。--emk 2007年5月22日 (火) 11:54 (UTC)
- あどうも。これ、どう書いたらいいんでしょうね。JIS X 0208 では、付属書1「シフト符号化表現」ではいわゆる半角カナを追認しているけど、それ以外では基本的に認めていない、と読んだんですが。 --Hatukanezumi 2007年5月22日 (火) 12:51 (UTC)
ところで、emkさんは何度か「『JIS X 0208およびJIS X 0201に規定されている文字をつかう』という論拠には賛成できない」ということをおっしゃっているとおもうんですが、これはどういった意味あいでしょうか。
わたしの考えではこれは、「Unicodeに含まれるすべてのグリフを実装するよう閲覧者に要求することはせず、JIS X 0208/0201のレパートリを実装すれば最低限の水準の利用 (閲覧) を保証する」、という意味なのかとおもっています。文字集合以外のJIS X 0208本体や付属書の規定 (符号化方式など) についてまで、実装するよう要求しているものではないとおもいます。 --Hatukanezumi 2007年12月13日 (木) 01:32 (UTC)
- おおむねその通りです。JIS X 0208/0201のレパートリに制限すること自体には必ずしも反対しません。私が疑問なのは、その根拠をJIS X 0208/0201に求めることです。ウィキペディアではそれらの規格で定義されている符号化方式を使っていないからです。
- 「崎」の異体字が使われた記事に{{統合文字}}ではなく{{記事名の制約}}を貼るほうが適切である理由は、Unicodeベースでないと説明できません。
- たとえばJIS X 0221 附属書1の日本文字部分レパートリを根拠にできないでしょうか。--emk 2007年12月13日 (木) 11:14 (UTC)
- 応答ありがとうございます。
- それ (JIS X 0221-1の日本文字部分レパートリを根拠にする) も考えたことはあります。ただ、これは元来JIS X 0208 + JIS X 0212ベースで、JIS X 0213ベースになっている現在のJISの情報処理関連規格とは整合しません (そのため、2001年改訂で規定から参考に格下げされたはず)。JIS X 0221-2 (と -3?) が制定されて、この付属書に代わるあらたな規定ができるまでは、根拠にできないとおもいます (要するに、jaWPもあまり遠くない将来、JIS X 0213ベースに移行することになるだろう、とおもっている)。
- いっぽうでJIS X 0213も、まだ日本語専用環境でさえ普遍的な実装とはいえず、多くの分野であいかわらずJIS X 0208ベースのベンダコードページなんかが幅を利かせていたりします。そういうわけで、当面は「JIS X 0208/0201のレパートリ」というものを仮構して --- つまり、符号化方式などの規定は無視して文字集合だけに着目して ---、それにもとづく適合性を考えるしかないのかとおもっています。
- 他言語版ではこういう議論ってないんでしょうかね。たとえばMESのある水準の範囲内で記事を作成するよう推奨する、とか。……ないか。余談ですが、もしかすると、レパートリにこだわるのは、ほっとくと文字がどんどん増えてしまう漢字文化圏だからこそ、深刻な問題ととらえられるのかもしれません (でもって、やたら細部にこだわる日本人気質も影響してるのかも。ただ、「そんなもんわたしは知らない。好きにやる」と言ってもどうにもならんわけで) ね。 --Hatukanezumi 2007年12月13日 (木) 13:53 (UTC)
- 追記。JIS X 0208:1997本体7.3の「JIS X 0201 で規定される図形文字と同じ図形文字は用いてはならない」という規定も、符号化を前提としたものですね。単に図形文字集合として考えた場合、両者の「同じ図形文字」は区別がつかないはずです。
- ただ現実問題として、内部処理では、レガシーコードセットを介した往復互換性を確保するために両規格で規定される図形文字はしばしば区別され、そのために一方を代替名称にマップするということも行われています (わたし自身、そういうマッピングテーブルを実装したことがあります)。そしてまたそのような実装がわりと普通に存在することが、「JIS X 0201は半角、JIS X 0208は全角」という理解に根拠を与えることにもなっているのだとおもいます……と、これはそのうち全角や半角に加筆することにしますね。 --Hatukanezumi 2007年12月24日 (月) 13:10 (UTC)
- ずれたことを言ってました。JIS X 0221:2007を今日初めて読みました。
- 箇条12 (p.15) に言う「制限部分集合」として、付属書JA (参考)「日本語文字れパートリ」のBASIC JAPANESE日本語文字部分レパートリを使う、というようにしてはどうか、ということですね。
- しかし、いまのところ「参考」扱いのままですね。国際一致規格だからしかたがないのか。 --Hatukanezumi 2008年1月5日 (土) 04:59 (UTC)
- その通りです。附属書JAの最後に書かれているように、附属書が参考であること自体は適合性の主張に影響しないので問題ないのではないでしょうか。
- シフト符号化表現やRFC1468符号化表現は確かに「規定」ですが、それはそれらの符号化表現を実際に採用したときに初めて意味を持ちます。JIS X 0208:1997の3.3に書かれているとおり、適合性を主張する場合には符号化文字集合も7.1〜7.3、附属書1または附属書2から選ばなければなりません。それらの符号化文字集合を採用しないなら、JIS X 0221:2007の附属書JAが参考であることをもって、ただちにJIS X 0208より根拠として弱いとは言えないと思います。
- ちなみに日本人気質もあると思いますが、ベンダ定義の互換性のない独自拡張の乱立が、JIS X 0208外の文字の使用を忌避させる傾向に大いに影響を与えていると思います。--emk 2008年1月5日 (土) 16:55 (UTC)