ノート:2バイト言語
2バイト「言語」というのはそぐわないと思うのですが。2バイト文字で書こうが1バイト文字で書こうが「日本語(Nihongo)」は「日本語」なわけですし。Fx 13:45 2003年10月31日 (UTC)
- 同感です。DBCS(Double Byte Code Set)と勘違いしているような気がします。それと、「技術的な制約から実際にはその一部、94×94=8836字にしかエンコードできない」ってのも、どういう理屈なのか、よくわかりません。 秀の介 14:41 2003年10月31日 (UTC)
- 勘違いではない…と思います。Googleでも858件見つかりますし。ただコンピュータの世界で、というのは言い過ぎかもしれません。「DTPの世界、およびその周辺で言われる言葉」あたりが正確なのか……。しかしDTP以外のところでも、少なくとも5年前の時点で使われていた筈です。が、定義は何にせよ手を入れる必要がありますね。
94×94については、ワークスコーポレーションの『DTPスーパーしくみ大事典2002』(ちなみにこの本ではnバイト言語という言い方はしていません)の内容を参考にしました(そちらはもっと詳しかったのですが)が、ちょっと今手元にない(週末の間は開けない)ので、申し訳ありませんが、それを開くまでお待ちください……。これについては誤読しているかもしれません(それならばApplePublishingGlyphSet(APGS)などがどうやって実現できているのか…などが分かっていないため、自分自身「?」なのです)が… FeZn 16:20 2003年10月31日 (UTC) - 失礼しました。ノートPCの電池が切れかけたので慌てたところが平仮名のままでした(汗
急いでいたので書けなかったのですが、個人的には「シングル/ダブルバイト」が正しいのだと思っていました。が、ヒットする件数が少なかったのでこちらを選んでいます。ただ、どこかの記事へのリダイレクトでも良いような気もします。『2バイト文字で書こうが1バイト文字で書こうが「日本語(Nihongo)」は「日本語」』というのに非常に得心がいったためです。FeZn 17:56 2003年10月31日 (UTC)
- 勘違いではない…と思います。Googleでも858件見つかりますし。ただコンピュータの世界で、というのは言い過ぎかもしれません。「DTPの世界、およびその周辺で言われる言葉」あたりが正確なのか……。しかしDTP以外のところでも、少なくとも5年前の時点で使われていた筈です。が、定義は何にせよ手を入れる必要がありますね。
これって、かなり文脈依存ですよね。日本語で言えば、EUCとかJISとかの文字コードが「現時点で」広く使われているから「2バイト文字」と呼称できるんです。それ以前の「半角カナ」しか存在しなかった時代とか、Wikipediaで使われているUnicode (UTF-8?)では、「日本語は2バイト文字である」というのは誤りになります。この記事内で書くにしても、redirectするにしても、そのあたりの文脈をきちんと説明しないといけないと思います。(redirectするなら、文字コードが適当でしょうか。)Ojigiri 19:14 2003年10月31日 (UTC)
うーん、Ojigiriさんの説明も変です。キャラクタセット(文字集合)とエンコーディング(符号化方式)がごっちゃになっています。たぶん、エンコーディングのことを言っているんだと思いますが。文字コードを挙げてくれたのなら、じっくり読んで理解することをおすすめします。いずれにしても、今のままでは誤解を生むこと必定なので、白紙化した方がいいと思います。 秀の介 01:33 2003年11月1日 (UTC)
- TRONコードも英数字2バイトなわけですが、これは例外だと思っていました。そういえばUnicodも全部2バイトでしたか(こちらは忘れていました)。ますます問題。用語の混同になっているのは事実ですが、そういった状況で使われているわけですよね。(「時間」と「時刻」もその意味では近い?) とりあえず1バイト言語ともども文頭にCaution入れておきます。
- あまり関係ないですが、それと日本語でも、外字フォントやカナのフォントにも1バイトのものがありますね。FeZn 03:10 2003年11月1日 (UTC)
- UnicodeもUTF-8だと最大4バイトになるので、一概に1バイト2バイトと言えないのが悩ましいところです。どちらにしろ、「言語」と「文字コード」は一対一の概念ではないので、この項目はリダイレクトなりその旨を解説するなりしたほうが良いかと思います。
- なお、「94×94」に関しては、「技術的な制約」というよりは「規格上の制限」としたほうがふさわしいかと思います。ちなみに、94という数の根拠は、文字コードとして$21~$7Eまで(ASCIIコード)を使用可能としたためです。中国・韓国の文字コードもJISX0208等と同様に94×94の文字表になっています(台湾は少々面倒)。Fx 08:21 2003年11月1日 (UTC)
文字コードへリダイレクトすることを提案します。もし、どうしてもこの記事を残したいなら、あくまでも俗称として、そう呼ばれると明記した方がいいですね。秀の介 07:24 2003年11月2日 (UTC)
- 今日あれこれ(日本などでの、かなや漢字などをコンピュータで扱えるようにするための涙ぐましい努力の話とか)調べて来まして、どうやら[[マルチバイト処理]](多バイト処理)へのリダイレクトが良いようです。が、その内容についてはさっぱり分かりません(汗)なので、文字コードの一部につなぐこと正解なのですかね。なににせよZDnetでもe-wordsでも自明のこととして説明なしで使っている言葉なので、わかりやすく説明しないといけませんね。(それこそ難しそうなのですが……)
Fxさんも有難うございました。「規格上の制限」にしておきます。FeZn 11:10 2003年11月2日 (UTC)
- 「マルチバイト処理」ですか。その記事自体はよいと思うのですが、ここからリダイレクトはどうでしょうか?日本語や中国語などがラテン系の言語とは違うということを言いたいでしょうか。FeZnさんが、どのような内容の記事を書きたいのかが、今ひとつ見えないのです。
- けちを付けているように思われたら謝りますが、できるだけ正確な内容にしていきたいと思うのです。
- すみません。「ここからリダイレクト」というのが少々わかりません。
それからこれも説明不足でしたね。多分方向性に大きな違いは無いと思うのですが……、シングル/1バイト、ダブル/マルチ/2バイト言語、といった用語が、実際あちこちで何の説明もなく使われているので、この言葉に触れた当初自分自身が困惑してしまったことが発端です。それを人に説明するときにもなかなかうまくいかず、それでいてこの言葉で通じないと、適切に一言で説明する単語が存在しないのでますます困ってしまうわけです。
ええとつまり、「メディアでもメーカーでも普通に使っている(別に彼らがごっちゃにして使ってるから正しいというのではなく、だからこそ問題なのだというのは同感です)」→「しかしきちんとした説明がなされていない(マルチバイト処理の話の一部として扱っている個人ページなどはある)」→「だからこそWikipediaではきちんと説明つけないといけない」という考えです。(これで通じますか?)
ちょうど今Wikipedia‐ノート:秀逸な記事への返信でも書いているのですが、初心者の立場になって、ある言葉について知りたいときに、百科事典を引いたらその言葉が載っていることを期待するわけです。
自分と同じ道を後から来る人に(と言うとおこがましいようですが、自分より知識の豊富な人にはもとより不要でしょうから)、その言葉が何を意味しており、どのように理解すべきなのか、を知るための手引きとなれば良い、というのが基本姿勢です。
この記事はそもそも、もとをたどればQuark XPressから参照することを第1の前提として考えていました。いわゆる1バイト言語版と2バイト言語版では大きく価格設定からして違う---そのため怨嗟の声が上がるのですが(笑)---ので、英語版/日本語版というだけではくくれないため使われています。外のサイトやニュース、仕事上の会話などでその単語に触れたある人物が、Wikipediaで検索して、必要な情報にたどりつくことができさえすれば、どこの記事にあっても良いと思います。(なのでQuark XPressの中に書いてしまうべきだったかと思ったのですが、以前より聞いた言葉だったので改めて調べてみたところ、コンピュータで漢字などを扱えるようにするための努力、という文脈で出てくるのだと知るに至りました)
いま書いていて気づいたのですが、要は「英語・フランス語などの○○○○○○な文字言語の『総称』」あるいは『ひとまとめにして指すための便宜的な言葉』※○○○○○○部分はとりあえず省略(汗) ……というべきでしょうか。
なんだか長くなった上に同じ内容が繰り返されていますがなんとか読み取っていただけたら幸いです。m(_ _)m ---FeZn 13:23 2003年11月2日 (UTC)
- すみません。「ここからリダイレクト」というのが少々わかりません。
- 丁寧な説明、ありがとうございます。まず、
- ここからリダイレクト
- は、2バイト言語から、#redirect [[マルチバイト処理]]とかやることです。
- 丁寧な説明、ありがとうございます。まず、
- で、本題ですが、僕の言いたいことは言い尽くしましたし、FeZnさんにもわかっていただけたようなので、FeZnさんの最後のコメントの内容で書いてみませんか?その上で、何か意見があれば、ここに書かせていただきたいと思います。秀の介 13:50 2003年11月2日 (UTC)
- RESありがとございます。
分からなかったのはその一文の中の「どうでしょうか?」の部分が中心でした。でもそれで分かりました。「如何なものか」という意味だったのですね。
問題は、上の○○○○○○の部分はむしろ自分が知りたい、ぐらいになってしまっている点です。(汗) いささかならず難題なので、ぼちぼち取り掛かることにします…… FeZn 15:30 2003年11月2日 (UTC)
- RESありがとございます。
というわけでいちおう出来上がりました。が……はて。より詳しく書きたいところですが、墓穴を掘りそうなのでこのあたりで。FeZn 16:17 2003年11月9日 (UTC)