プロジェクト‐ノート:翻訳検証
過去ログ一覧 |
---|
コンテンツ翻訳の機械翻訳機能廃止に向けて―議論提起と今後の構想のお知らせ
[編集]いつもお世話になっております。McYataです。事後報告となり申し訳ないのですが、「コンテンツ翻訳内の機械翻訳機能廃止」へ具体的に動き出すために、財団側の方とクローズドな情報共有ミーティングを行いました。まずはWikipedia:井戸端#財団の方とミーティングを行いました&機械翻訳機能廃止を要請するための日本語版合意形成提案(過去ログ)をご覧いただき、皆さまのご意見をいただきたいです。
次の段階に向けて動き始めようと考えた背景には、皆さまのご協力によりコンテンツ翻訳レビューが進展して「機械翻訳機能が深刻な問題を引き起こしている」といえるだけの十分なデータがそろい、またG-3削除方針が成立したことで「機械翻訳依存を排除する」という広いコンセンサスがとれたことがあります。これらから、2019年から長きにわたって議論されてきた「財団との交渉材料は出そろった」と考えました。ここまで至ったからには、井戸端でAppleRingo777さんが言及している通り、時間をかけすぎても目標を達成するのが難しくなってしまうでしょう。今ここで踏ん切りをつけ、コミュニティ内で状況を共有して、機械翻訳機能廃止のコンセンサスをとるための投票実施まで一気に持っていく時ではないでしょうか。
なおミーティングにはコンテンツ翻訳開発チームの方も参加していたのですが、その方から以下のような指摘(反論)をいただきました。正直、これまでの議論にかかわってきた方々ならうんざりするほど見てきているような「言い訳」の類で、私もこれらを想定してプレゼンしたつもりなのですが、力不足で説得まで至ることは出来ませんでした(ただ参加された方は機械翻訳機能の担当ではなく、「疑義が上がっている状況はよく分かったので担当にも伝えよう」と仰っていました)。
- 機械翻訳が誤訳をするのはどの言語版でも同じ
- 機械翻訳を使いこなせず粗悪な記事を公開してしまうのは、その利用者の責任である。コンテンツ翻訳の責任ではない。
- インドネシア語版は「機械翻訳率の閾値を設ける」という開発チーム側の提案を受け入れて「ハッピー」だと言っていた
- コンテンツ翻訳記事の削除率の推移は開発チームも言語版ごとに監視している。削除率が極端に上がれば、我々も「何か問題があるのか?」と聞きに行くだろう。
- 英語版では「機械翻訳機能を復活させてくれ」という声も上がっている。日本語版にも「機械翻訳は良い記事を作るために便利なツール」だと考えている利用者がいるはずだ。
すべてについて十分な反論が出来るだけの情報は持ち合わせているつもりです(後程、日本語版コミュニティ向けの説明もかねて、私論か何かで詳しく書こうかと思っています)。これらの論点についても、これまで機械翻訳とかかわってきた皆様のご意見をいただきたいです。--McYata(会話) 2022年6月25日 (土) 15:57 (UTC)
- 一般的な西洋言語からの翻訳以上に中日の場合はコンテンツ翻訳が吐き出す機械翻訳は、はっきり言って垃圾(rubbish)とだけ申しておきます。←この部分は原文ママでお伝えくださって結構です。
- 特に長文を翻訳する場合、機械翻訳の後始末をしなくていい分、自力翻訳のほうが効率的に作業できます。
- そして、そのような欠陥がありながらも、それをゴリ推ししている財団の姿勢も容認できませんし、ツールを使いこなしているつもりで結果的に使われてるだけの問題利用者側にも不信感があります。
- 機能廃止が1日でも早く訪れることを願っています。廃止できないのであれば、拡張承認された利用者以外は利用者名前空間にしか出せなくするというのも一つの手かと思います(英語版や中国語版で実施されているドラフト制度)。--Tze Chiang Hao(会話) 2022年6月26日 (日) 00:20 (UTC)
- 開発チームの方からの指摘は、McYataさんがすでに反論材料を揃えているわけで、私からこれ以上何か述べる必要はなさそうです。「拡張承認された利用者以外がコンテンツ翻訳を利用して、標準名前空間に投稿することを(機械翻訳の有無にかかわらず)禁じる」、もしくは「コンテンツ翻訳ツールを利用して日本語版に投稿することを禁じる」ならば、編集フィルターでできることを申し上げておきます。すなわち、日本語版で合意できれば財団/開発チームが対応を拒否した場合もローカルでの対処手段はあります。--ネイ(会話) 2022年6月26日 (日) 07:16 (UTC)
- コメント ネイ氏の提案は非常に興味深いものがあります。財団との交渉が決裂したとしも実装できるのであれば賛成です。「拡張承認」というのは日本語版のことでしょうか?例えば外国語版で拡張承認されているが日本語版ではされていない利用者の扱いについてはどういったケースを想定されていますか?外国語版で拡張承認され、かつ無期限ブロックされているが、グローバルブロックには至っていないという(日本語話者ではない)利用者に対してもフィルターが有効であればなあ、と個人的に思うところです。--Tze Chiang Hao(会話) 2022年6月26日 (日) 07:59 (UTC)
- 日本語版です。ローカルの編集フィルターなので、他言語版の拡張承認を参照することはできません。--ネイ(会話) 2022年7月2日 (土) 13:09 (UTC)
- この編集フィルターブロック全般について、財団に理解頂けなかった場合の対処手段をこちらが有していることは、強力な交渉材料になりえると私は考えています。別に編集フィルターでできるのであれば、わざわざ財団と話しあう意味がないのですからね。まあ、私は穏便に行きたいと考えていますが。
- 同様に考えれば、翻訳する際の履歴継承に用いる言語間リンクを検出することにより、Draft名前空間以外に公開することを禁止したり、極論(コンテンツ翻訳を禁止した結果として、コピペ翻訳が増えた場合)記事の翻訳を新利用者グループの「翻訳者(一例)」に限ることも可能なのですね。このような考え方は、そもそも翻訳という作業が非常に難解なものであるということを再確認したからです。ともかく、とても有用な情報提供に感謝いたします。--Sethemhat(会話) 2022年7月2日 (土) 13:45 (UTC)
- 日本語版です。ローカルの編集フィルターなので、他言語版の拡張承認を参照することはできません。--ネイ(会話) 2022年7月2日 (土) 13:09 (UTC)
- コメント ネイ氏の提案は非常に興味深いものがあります。財団との交渉が決裂したとしも実装できるのであれば賛成です。「拡張承認」というのは日本語版のことでしょうか?例えば外国語版で拡張承認されているが日本語版ではされていない利用者の扱いについてはどういったケースを想定されていますか?外国語版で拡張承認され、かつ無期限ブロックされているが、グローバルブロックには至っていないという(日本語話者ではない)利用者に対してもフィルターが有効であればなあ、と個人的に思うところです。--Tze Chiang Hao(会話) 2022年6月26日 (日) 07:59 (UTC)
- 開発チームの方からの指摘は、McYataさんがすでに反論材料を揃えているわけで、私からこれ以上何か述べる必要はなさそうです。「拡張承認された利用者以外がコンテンツ翻訳を利用して、標準名前空間に投稿することを(機械翻訳の有無にかかわらず)禁じる」、もしくは「コンテンツ翻訳ツールを利用して日本語版に投稿することを禁じる」ならば、編集フィルターでできることを申し上げておきます。すなわち、日本語版で合意できれば財団/開発チームが対応を拒否した場合もローカルでの対処手段はあります。--ネイ(会話) 2022年6月26日 (日) 07:16 (UTC)
- コメント まずは財団側の皆さんとの交渉などに動いていただき、ありがとうございます。これまで日本語版で議論してきたことを、どう実装に持っていくのか、というところは不明瞭な部分もありましたし、今回のミーティングのおかげで財団側の姿勢であったり、次のアクションが分かり易くなったと思います。
- さて、コンテンツ翻訳の機械翻訳機能を廃止するための合意形成に進むことには賛成です。McYataさんも指摘されている通り、現状財団側から上がっている反論は、日本語版の問題点が無視されている、もしくは日本語特有の事情が加味されていない、といったものに過ぎません。プロジェクト:翻訳検証でも現状明らかなように、リソースが不足しているわけで、根本的に流入側を締める対策を取る必要があります。一つだけ注意したいのは、「機械翻訳をコンテンツ翻訳で使えないようにする」ことと「拡張承認された利用者だけがコンテンツ翻訳を遣えるようにする」ことは、イコールではない点かと思います。前者には賛成だが後者には反対、といった方が一律に反対もしくは賛成とならないよう、切り分けて議論を進めていくべきかと存じます。 --紅い目の女の子(会話/履歴) 2022年6月27日 (月) 02:52 (UTC)
- コメント McYataさん、情報提供ありがとうございます。インドネシア語版の事例につきましては、ベトナム語版からのコンテンツ翻訳の拡張承認未満の利用制限の要望(phab:T299636)において、財団側からの閾値での提案が受け入れられずにベトナム語版の要望が通った反例があります。この事例は、viwikiがコンテンツ翻訳の削除率の高い言語として挙げられていないことも含めて、今後の交渉の参考になるのではないかと思います。ただ、この事例は機械翻訳を制限する要望ではないので、そこが気がかりではあります(機械翻訳に対する要望を挙げたアラビア語版があの状態なので)。--Junknote(会話) 2022年6月28日 (火) 08:31 (UTC)
- コメント 2か月がたちましたが、この問題について進展がありません。どうすればよいのでしょうか。--Sethemhat(会話) 2022年8月25日 (木) 12:17 (UTC)
- すでにUser:OmotechoさんがMetaにてコンテンツ翻訳の製作者とすこし対話をされておられるようですが、もやはこの問題に進展が見えない以上、前述のメタのページに「自動翻訳機能をオフにしなければ、jawpではコンテンツ翻訳を全面禁止するぞ」と脅しをかける段階に入っていると考えます。これを実行してもよいでしょうか。皆様の意見をお待ちしております。--Sethemhat(会話) 2022年9月3日 (土) 08:20 (UTC)
- しばらくご無沙汰でした。メタでいろいろなドアを叩いてきましたが、開かない扉だらけだと解りました。メディアウィキのCX2専用トークページに「これは使いにくい」という声が上がるのですが、3年前よりも四倍に増えた印象です(この件、後述)。
- そこで、実利を先行させませんか。CX2が公認の拡張機能でもポンコツなら、ローカルで対処をとる。日本語版で合意を築き、CX2から記事名前空間への出稿を処理すれば、それで十分では? ただし、管理者の皆さんに負担が増えるのでは、大元のメディアウィキに挑むほかないかもしれないです。これは別件、私論でも書きます。
- 皆さんが出してくださった案を一覧にします。それぞれ特徴があるのですが、費用対効果と、実現可能性を可視化しましょう。もちろん、両論賛成はしたくない方もおられると思いますから、多数決にするためではありません。
- 「機械翻訳をコンテンツ翻訳で使えないようにする」ことと「拡張承認された利用者だけがコンテンツ翻訳を遣えるようにする」ことは、イコールではない(@紅い目の女の子さん 2022年6月27日 (月) 02:52 (UTC)時点)
- どのあたりに落とし所を求めるのか、見てみたいです。Sethemhatさんが焦れておられるのも、そこでは? 管理者に頼むなら頼むで、道筋が決まっています。そこに載せるかどうかで止まっているだけでは?
- 不明点
- 費用対効果。ローカル(日本語版ウィキペディア)単体で実現でき、管理者がしんどくない案の順位。(翻訳新記事の見回りは楽になるが誰かにツケが回らないか)
- 1を考えずに、優先順位を与えるなら、どうなる?
- 作業の流れ図。
- 合意形成とは。このスレッドで合意すれば必要十分か? それともアンケート調査など、分母の大きな合意形成が必要ですか?
- 管理者伝言板へ依頼を書くだけで良いのか?
- 工程表。
- 見直しもしくは再度、話し合う。
- 仮番
- どうするか、[改行] *提案者・備考
- 01
- 02
- 「コンテンツ翻訳ツールを利用して日本語版に投稿することを禁じる」
- 編集フィルターで対処[※ 1]。
- 03
- Draft名前空間(利用者/sandboxのこと?)以外に公開することを禁止。条件は、利用者の履歴継承にフィルタをかける。履歴 > 翻訳記事 > 言語間リンク?
- そもそも翻訳という作業が非常に難解なものである[※ 2]。
- ところでSethemhatさんに一言。
- (前略)すでにOmotechoさんがMetaにてコンテンツ翻訳の製作者とすこし対話をされておられるようですが、(後略)--Sethemhat(会話) 2022年9月3日 (土) 08:20 (UTC)
- 【ここから加除修正、下線部を補足】「Omotechoさんは」と書いてリンクで呼び出されたので上記をまとめました。接頭辞「mw」はメタではないのでご注意いただきたいのと、メタは恐ろしいところと考える人は少なくないと見ており、「中途半端な言及は迷惑です」と申しあげるほかありません。Omotechoの当該の投稿は、CX2ご意見ご感想ノートページに寄せた物です(サイトはメディアウィキ)。「CX2から出稿した翻訳記事を峻別する手段は{{tl:翻訳告知}}の活用」と他の人が発言したので、コメントとして「CX2出稿の記事は、自動的に『翻訳告知』テンプレートをその記事のノートページに付与してほしい」と提案しました[※ 3]。
- 注
-
- すでにUser:OmotechoさんがMetaにてコンテンツ翻訳の製作者とすこし対話をされておられるようですが、もやはこの問題に進展が見えない以上、前述のメタのページに「自動翻訳機能をオフにしなければ、jawpではコンテンツ翻訳を全面禁止するぞ」と脅しをかける段階に入っていると考えます。これを実行してもよいでしょうか。皆様の意見をお待ちしております。--Sethemhat(会話) 2022年9月3日 (土) 08:20 (UTC)
- 一部発言を編集、不穏当であり反省します。--Omotecho(会話) 2022年9月10日 (土) 14:25 (UTC) / --Omotecho(会話) 2022年9月3日 (土) 14:24 (UTC)
- ここでOmotechoさんも仰るように日本語版だけで完結することを、あえて私がMediawikiと交渉のすべを残そうとしているのか述べたいと思います。皆さんと円滑に思考の共有をするためです。
- コンテンツ翻訳=悪ではないこと。レビュースペースの1月のところを見て頂けるとお分かりの通り、50%の記事はOKなものです。この半分の方が普通の翻訳手段を用いて翻訳いただければよいのですが、コンテンツ翻訳が廃止されれば止めてしまわれるかもしれません。なので、出来るだけ無関係の善意の方を巻き込まないためにコンテンツ翻訳は存続が最善と考えています。
- 財団との関係。下のMcYataさんのコメントでかなり不穏な雰囲気が漂っておりますが、出来るだけ悪化させたくはありません。こちらはコンテンツ翻訳を禁止するまでは言っていないと先方に言い、武器をちらつかせながらですが理解を求めるのがウィキペディア的合意形成かと考えています。
- 他言語版での実施可能性。この問題により太古の昔にアラビア語版、最近でもベトナム語版でも悲鳴が上がっています。ここでJawikiが先陣を切り機械翻訳を停止させれば、他の言語版でもこの操作を実行しやすくなるかもしれません。
- 以上により、私が先にコンテンツ翻訳製作チームと交渉すべきと考えています。しかし、もしJawikiで先にコンテンツ翻訳からの記事を閉めるべきという意見が多数を占めた場合はこの限りではありません。
- 議論の本筋に戻ります。「管理者に負担がかからない」という観点では、直接交渉が管理者とは無関係ですが、編集フィルターでの処理は一回コードを書いていただくだけで済みますので、手動で何かをしなければならないというものが発生しない以上、あまり負担が大きいとは思いません。合意形成は、ここにいるメンバーで交渉かどうかを決め、もしコンテンツ翻訳一括禁止となれば利用者すべてか、拡張承認に絞るかどうかをここで議論した後、コメント依頼に出すのがよいと考えます。
- ともかく、直接交渉をすべきかどうか(または、しても問題ないか)というのが議論の中心だと思います。言い忘れておりましたが、直接交渉というのは私がやりますので議論参加者の皆様のご負担になるようなことはありません。--Sethemhat(会話) 2022年9月4日 (日) 13:20 (UTC)
- ご説明がとてもよくわかりました。ご指定の2022年1月度統計、記事として水準を満たすものは5割ですか。多いような少ないような。
- >ここでOmotechoさんも仰るように日本語版だけで完結することを、あえて私がMediawikiと交渉のすべを残そうとしているのか述べたいと思います。
- では、複合的に進めそうですね。
- CX2の改善が必要だとメディアウィキに提言する。
- 実利先行のローカルでCX2から日本語版ウィキペディアの標準空間(記事名前空間)へ、出稿制限をかける。
- 出稿制限の試行
- データの見える化のためにも暫定期間を設けて、出稿制限をかけてはどうでしょうか? 対処すべき記事件数を、少しでも低減できたらという苦肉の策です。
- たとえば3か月でも試験的に出稿の制限を行い、統計をとり品質が劣る「事故率」を見える化する案です。すると比較データはすでに積み上げておられますので、後追いでもメディアウィキでの交渉に添付し、お役に立たないでしょうか?
- 小出しに変化を持ち込み、場合によっては戻すリスク。
- コミュニティが混乱する
- 管理者の手間。
- 判断材料として、CX2を使った出稿をする人は、常駐編集者三千五百人(援用:投票の有権者数)に対して、どれくらいの率でしょう? お分かりでしたら教えてくださいませんか?--Omotecho(会話) 2022年9月6日 (火) 03:52 (UTC)
- 情報 @user:Omotechoさん、取り急ぎコンテンツ翻訳がどれくらい使用されているかを過去20か月分で調査しました。利用者:Junknote/CX2日本語版統計をご参照ください。--Junknote(会話) 2022年9月6日 (火) 06:48 (UTC)
- ありがとうございます @Junknoteさん拝見しました。あっという間にこの表ができるとは思えず、お手数をおかけしました、ありがとうございます。いやぁ。数値にすると、グッと苦味が減ったような(~.~;) 分母は1万の桁が良いですかね、それとも常駐人口値を少し絞って、直近の連続の編集回数などで足切りをすると3500人(投票の有権者の条件並みにする)、ただ対策に当たっている編集者は、実はもっと情熱を傾けたい主題をお持ちのはず。それを諦めて奉仕をする人たちだとするなら、それを数値に現せないか。1万人が80数名の対策に当たっているのではないし、「1万人のうちの八十人じゃあ、想定内だ、我慢しなさいよ」と言われないために数字を操作したくないですし。
- 嫌な方もあるかと思うのですが、携わっておられる編集者の数を、仮定で良いので掴めないか。もう少し目に見えると説得力が増します。次の3番以下は、CX2を使わずとも、また翻訳記事に限らない作業ですから、どのように対照できるでしょうか。
- CX2出稿の落第記事(事故)を削除する作業時間、作業量
- ぎりぎり及第点に達するよう、書き換える作業時間、作業量
- 翻訳原文が検証可能性を満たしていないため、資料をたくさん当たったり。
- 場合によっては「●●語版に偏重」した内容を、グローバルまたは日本語話者の社会に近づけたり。
- 何かお知恵はありませんか。数字データで押すなら、これまで希望が通らなかった言語版と同じ末路を避けられそうな予感がします。ただし日本語版ウィキペディアはパイが大きい(参加者数が多い)ため、条件で絞り込むまで、データが見た目、小さいです。
一点、表のクラスを並べ替え可能にしてくださるとありがたいのですが、動かしたくない列・行の指定を失念してしまいました。- {| class="wikitable sortable"(以下同文)
- {| class="wikitable sortable"(以下同文)
- --Omotecho(会話) 2022年9月10日 (土) 15:14 (UTC)
- コメント かなり事後になりましたが、ソート可能なウィキテーブルへ対応致しました。挙げていただいたOmotechoさんの懸念は理解できるところです。母数に統計ページの活動中利用者数や、理事会選挙の有権者数といった利用者数を持ってきてしまうと、その割合の見た目の小ささから問題が矮小化されかねないと感じます。そうしますと、数字として表すのであれば、やはり対応にかかる手間(工数)部分を見える化して比較するという作業になってくるのではないかと思います。私の考えるところでは、例えばレビュースペースの結果が出ている部分をさらに精査する、問題のある記事数と対応された記事数、また、対応の内訳として改訳・改稿をした利用者数、削除を依頼した利用者数など、対応が行なわれた部分の数値化でしょうか。対応する利用者に対して、事案発生数が多すぎるという論点の補助にはなりそうには思えます。--Junknote(会話) 2022年9月11日 (日) 23:13 (UTC)
- @Junknoteさん、なるほど分母よりも実態を立体的に述べるデータですね。簡単に抽出できそうと思って分母を示して早計でした。
- @Sethemhatさんのお申し出はとても貴重です。このスレッドの共通の認識を振り返ってみたのですが、メタウィキのあちこちを覗いたせいか、機械翻訳擁護派に日本の事情は見えていないと気になります。いかにも外野ぶって書いたとも読めるため、寝かせておこうかと考えましたが、熱が冷める前にお目にかけます。小見出しにします。--Omotecho(会話) 2022年9月12日 (月) 01:45 (UTC)
- 自己レスです。メタウィキなりメディアウィキで交渉するとしたら、他言語版のCX2対策はどうなっているのか事例集があるといかがでしょうか。あるいは、すでにどなたか調べておられるよというお知恵がありましたら、教えてください。
- 英語版の事例研究のため試訳。下位ページに、en:Wikipedia:Content_translation_tool を試訳します。ほんの少し読んだところで「拡張承認を受けた利用者のみ使えるように制限する」と述べてあり、このスレッドで検討している手順は整合性があると感じます。
- 以下の手順で版を継承。Copied to translate from enwp: 翻訳のため転記、テンプレート無効化、内部リンクに「:en:」を付与して赤リンクを回避、カテゴリnowkiで無効化。原文の特定版は、&oldid=1104658120 2022年8月16日05:35 (UTC) 時点における Czar による版 (IP利用者 による版を Jackfork による版に差し戻し)。
- --Omotecho(会話) 2022年9月14日 (水) 11:35 (UTC)
- Omotechoさん、en:WP:Content translation toolの翻訳ありがとうございます。改めて英語版で制限されている現状や経緯が把握しやすくなったと思います。他言語版のCX2対策ということでは、コンテンツ翻訳のphpのパラメータを眺めていて気になったのですが、ドイツ語版も機械翻訳無効にされているように見えます。具体的には、wgContentTranslationEnableMT(コンテンツ翻訳の機械翻訳の利用可否パラメータ)の英語版(enwiki)は勿論falseになっているのですが、ドイツ語版(dewiki)もfalseに設定されており、変更履歴は見つけたものの、ドイツ語版での機械翻訳の無効化の合意形成や議論が見当たりませんでした。この点、何かご存じの方いらっしゃれば、ご教示いただければ幸いです。--Junknote(会話) 2022年9月14日 (水) 23:54 (UTC)
- すみません、少しこの議論を放置してしまっていました。
- @Omotechoさんが仰ります議論の傾向として、Mediawikiでjawikiの機械翻訳をオフにするように申し入れるのと同時に、コンテンツ翻訳からの記事をすべてストップさせることも実行するということでしょうか。「実利先行」とありますが、正直に言えば私はこれは微妙かなと思っています。善意の方を巻き込みたくはないと考えています。ただし、直近ではこんな例(1、2)がありますし、拡張承認未満の利用者の利用を制限するならば賛成します。
- 私今忙しいため、Mediawikiに申し入れるのは10月中旬ごろになりそうです。ただし、Jawp内での議論にはできる限り対応するようにします。
- Junknoteさんのドイツ語版のも議論材料になりそうです。--Sethemhat(会話) 2022年10月2日 (日) 12:49 (UTC)
- インデントを戻したほうがよければ、よろしくお願いします。
- Sethemhat さんの2022年9月4日 (日) 13:20 (UTC) 時点のご発言に戻っても良いでしょうか。グローバルな視点で以下にまとめておられます。
- >1. コンテンツ翻訳=悪ではないこと。
- >2. 財団との関係。
- >3. 他言語版での実施可能性。
- -----
- 私Omomtechoが日本語版ウィキペディアでローカルに、実利的に考える対策は、以下の1点からご相談したいです。
- CX2の作業結果の出力先
- 記事名前空間(標準名前空間)へ直接、出力させるかさせないかが一つの課題と思います。サンドボックスに置くなら、見回りの労力は減るでしょうか? でも、サンドボックスで改稿を手伝ってほしいと依頼を出したい場合、どうフォローしますか?
- -o 原則、CX2から記事名前空間へ出力させないとする場合。閾値を設けるか。編集回数や、ブロック有無などを基準に、直接、記事名前空間に出力できるようにする。編集初学者はこれで、サンドボックスにのみ出力することになります。
- -o 「1」を認めない場合に、CX2の出力先を個人のサンドボックスに限定するかどうか。
- -o 誰でもCX2から現状どおり、いきなり記事を立項して何の問題もない。
- 「2-o」の弱点。既存の善意の寄稿者を峻別する必要があるのかどうか。寄稿者は全員、改名の手続をしないとCX2翻訳機能による立項ができなくなります。善意の、寄稿歴が長い人は割を食います。
- 編集回数500回でアカウント登録後の日数制限を設けるなどか?
- この条件は、検討から外せば公平だと思います。CX2上で推敲を重ねずに出稿する「失敗事例」と編集歴の統計がわからないため。
- 上記に整理した私の現状認識です。対比が英語版に偏っているのは、ドイツ語が読めないためです。どなたかフランス語版、ドイツ語版の例をご存知でしたら、教えてください。
- o 日本語版にはサンドボックスで下書きをさせ、それを記事名前空間へ移動(改名)する措置に強制的な査読制度はありません。
- o 英語版では巡回者が記事として寝れていないものをサンドボックスすなわち下書き空間へ移動する権限があるようです。(実際に経験したので、おそらく間違いではない)
- o 英語版にもどのくらい記事が成熟したら下書きから記事に昇格させるか、合理的な基準がないようです。
- o 失敗事例の救済というか、「ダッシュボード」という自習の研修過程があります。そこに編集のイロハも翻訳記事の心得も載っているので、翻訳しているところです。
- フェアでないなと感じるところは、私自身の反省点でもあります。ろくにやり方を教えず、あそこを読め、ここに書いてあると説諭する私たちのやり方です。教材がないから他に方法がないと言えば、それも事実だったのですが、そこも変えたい。
- 幸い、ダッシュボードという機能があります。ウィキペディアではない空間にあるため、「{{tl:welcome}}」にリンクを追加する前に整理すると、どうやってそれを紹介するのか。あるいはダッシュボードで質問したい場合に、どうやってやる気のある寄稿者に応えていけるのか。(この辺りの基本は私のサンドボックスに私論を書きました。)
- 翻訳の基本を読もうにも、初学者が慣れない用語や不文律まで目を配れと強制するようなものではありませんか? それを生存するのがウィキペディア参加の条件とするような姿勢は、変な言い方ですが昭和すぎる。20年くらい時代に遅れているようにも思います。--Omotecho(会話) 2022年10月2日 (日) 14:29 (UTC)
- Omotechoさん、en:WP:Content translation toolの翻訳ありがとうございます。改めて英語版で制限されている現状や経緯が把握しやすくなったと思います。他言語版のCX2対策ということでは、コンテンツ翻訳のphpのパラメータを眺めていて気になったのですが、ドイツ語版も機械翻訳無効にされているように見えます。具体的には、wgContentTranslationEnableMT(コンテンツ翻訳の機械翻訳の利用可否パラメータ)の英語版(enwiki)は勿論falseになっているのですが、ドイツ語版(dewiki)もfalseに設定されており、変更履歴は見つけたものの、ドイツ語版での機械翻訳の無効化の合意形成や議論が見当たりませんでした。この点、何かご存じの方いらっしゃれば、ご教示いただければ幸いです。--Junknote(会話) 2022年9月14日 (水) 23:54 (UTC)
- 自己レスです。メタウィキなりメディアウィキで交渉するとしたら、他言語版のCX2対策はどうなっているのか事例集があるといかがでしょうか。あるいは、すでにどなたか調べておられるよというお知恵がありましたら、教えてください。
- コメント かなり事後になりましたが、ソート可能なウィキテーブルへ対応致しました。挙げていただいたOmotechoさんの懸念は理解できるところです。母数に統計ページの活動中利用者数や、理事会選挙の有権者数といった利用者数を持ってきてしまうと、その割合の見た目の小ささから問題が矮小化されかねないと感じます。そうしますと、数字として表すのであれば、やはり対応にかかる手間(工数)部分を見える化して比較するという作業になってくるのではないかと思います。私の考えるところでは、例えばレビュースペースの結果が出ている部分をさらに精査する、問題のある記事数と対応された記事数、また、対応の内訳として改訳・改稿をした利用者数、削除を依頼した利用者数など、対応が行なわれた部分の数値化でしょうか。対応する利用者に対して、事案発生数が多すぎるという論点の補助にはなりそうには思えます。--Junknote(会話) 2022年9月11日 (日) 23:13 (UTC)
- 情報 @user:Omotechoさん、取り急ぎコンテンツ翻訳がどれくらい使用されているかを過去20か月分で調査しました。利用者:Junknote/CX2日本語版統計をご参照ください。--Junknote(会話) 2022年9月6日 (火) 06:48 (UTC)
- ご説明がとてもよくわかりました。ご指定の2022年1月度統計、記事として水準を満たすものは5割ですか。多いような少ないような。
* コメント やはり、編集回数でのリミットは不適切かもしれませんね。例として 挙げて恐縮ですが、YellowSmileyFaceさんの編集回数は780回です。しかし、この方は500回未満の時にも問題のない翻訳(機械翻訳そのままの「翻訳」が多いのでこのような言い方をしています)をされておられており、これを制限するのは道理が通りません。しかし、代案はすべての利用者に対して利用者名前空間への出稿のみに制限するか、全制限か、あるいは特定の利用者のみ解禁、その他はダメという方法もあります。ただし、これはJunknoteさんの統計によると80人居り、その半分の40に許可をするとしても、かなり手間がかかります。ただし、もし制限をかけるとしても、日本語版で機械翻訳がオフになれば、止める理由はありませんのでただちに解消されます。あくまでも、財団が動くまでの措置です。
やはり、財団対処まで我慢してもらうという方法はまずいので、一回財団に話を通しませんか。もし財団が渋るようであれば(McYataさんのコメントを見る限りその可能性が高そうですが)その時考えるということにしませんか。財団がすんなり受け入れた場合、この議論は時間の無駄になってしまう可能性があります。
「翻訳の基本を読もうにも、」以降の文章も大いに共感するところで、翻訳のガイドラインも時代に合わせてそろそろ改訂の必要があるなとか考えています。多忙のため今は不可能なのですが。--Sethemhat(会話) 2022年10月5日 (水) 14:13 (UTC)
- コメント この説のコメントすべてを読む気はないので冒頭の方だけ読ませていただきました。個人的な意見としては、コンテンツ翻訳自体の廃止には反対だが、コンテンツ翻訳内での機械翻訳機能の廃止には賛成というようになると思います。当方はウィキペディアでの活動を始めた初期からコンテンツ翻訳を使わせていただいておりますが、コンテンツ翻訳を使うと他言語版でのウィキリンクが日本語版でのウィキリンクに自動的に変わるなど、翻訳者にとって使いやすい機能が多く備わってると考えています。しかし、当然ながら機械翻訳の品質は非常に低く問題なので、上記の通り、「コンテンツ翻訳自体の廃止には反対・機械翻訳機能の廃止には賛成」という立場を取らせていただきます。--YellowSmileyFace(会話) 2022年10月2日 (日) 17:22 (UTC) 署名位置を修正--YellowSmileyFace(会話) 2022年10月2日 (日) 17:51 (UTC)
- ご意見ありがとうございます。翻訳依頼でのYellowSmileyFaceさんのご活躍を拝見しております。
- もちろん、ここの議論参加者の共通認識はコンテンツ翻訳についている機械翻訳が悪というものですので、翻訳ツールとしてのコンテンツ翻訳へ制限をかける理由は全くございません。ただし、財団がコンテンツ翻訳内機械翻訳の廃止を渋った場合が面倒なことになります。全投稿者のコンテンツ翻訳記事を制限しなければならない事態になるかもしれません。--Sethemhat(会話) 2022年10月5日 (水) 14:13 (UTC)
- 返信 (Sethemhatさん宛) 認識は共通との事、安心しました。出来の悪い翻訳記事の立項に貢献する機械翻訳機能の廃止になぜ財団が渋るのかはわかりませんが、もしそのような場合にはコンテンツ翻訳の全般廃止となってしまうのかもしれないですね。その影響で善意の翻訳者がウィキペディアを立ち去ってしまうかもしれないので、そうならないよう願っております。もし財団との交渉の間で何か必要になられましたら、できるだけお力になりたいと思います。--YellowSmileyFace(会話) 2022年10月5日 (水) 23:53 (UTC)
- 報告 冒頭の井戸端リンク(下線部)を、過去ログに置き換えました。--Omotecho(会話) 2022年11月10日 (木) 10:32 (UTC)
編集フィルターでの制限
[編集]- コメント 一点気になったので情報共有のため、ご報告です。交渉の武器の一つとして考えられている「コンテンツ翻訳を日本語版ローカルで編集フィルター対処」ですが、今年phabricatorに要望のあった、ベトナム語版の「拡張承認ユーザ以外へのコンテンツ翻訳の投稿制限」の件(phab:T299636)の冒頭で「JSと不正利用フィルターを設定していたが、新Vector導入後には時代遅れとなった」と述べられており、対処内容としてwmf-config/InitialiseSettings.phpの修正が入っています。MediaWikiや編集フィルタ―に詳しくはないので、個人の感想レベルで恐縮なのですが、この修正を入れなければ、ローカル側の設定だけではフィルターが作動しない可能性があるように思えるのですが、いかがでしょうか。--Junknote(会話) 2022年9月5日 (月) 06:21 (UTC)
- 私にはJunknoteさん以上にその問題について不明ですので、編集フィルター編集者の方にお伺いしようと思ったのですが、何分知識が浅くJunknoteさんの意図の通りに説明できないと思います。そのため、@Junknoteさんご自身でWikipedia‐ノート:編集フィルターにて質問頂けないでしょうか。お手数おかけします。--Sethemhat(会話) 2022年9月13日 (火) 12:21 (UTC)
- Sethemhatさん、ご返答ありがとうございます。Wikipedia‐ノート:編集フィルター#コンテンツ翻訳に対する編集フィルタについてで本件について質問致しました。--Junknote(会話) 2022年9月14日 (水) 00:00 (UTC)
- 報告 編集フィルタ―のノートで質問していた件ですが、コンテンツ翻訳投稿時に生成される要約欄の内容をトリガーにして、投稿を制限することが可能と教えていただきました。ローカル側だけでの対処も可能なようです。--Junknote(会話) 2022年9月19日 (月) 23:01 (UTC)
- ありがとうございます
- @Junknoteさん、せっかく調べて動いてくださったのに今頃のコメントですみません。技術的にこのような対処の可能性があるのですね。ウィキペディアはつくづく深いです。 --Omotecho(会話) 2022年10月2日 (日) 14:37 (UTC)
- 報告 編集フィルタ―のノートで質問していた件ですが、コンテンツ翻訳投稿時に生成される要約欄の内容をトリガーにして、投稿を制限することが可能と教えていただきました。ローカル側だけでの対処も可能なようです。--Junknote(会話) 2022年9月19日 (月) 23:01 (UTC)
- Sethemhatさん、ご返答ありがとうございます。Wikipedia‐ノート:編集フィルター#コンテンツ翻訳に対する編集フィルタについてで本件について質問致しました。--Junknote(会話) 2022年9月14日 (水) 00:00 (UTC)
- 私にはJunknoteさん以上にその問題について不明ですので、編集フィルター編集者の方にお伺いしようと思ったのですが、何分知識が浅くJunknoteさんの意図の通りに説明できないと思います。そのため、@Junknoteさんご自身でWikipedia‐ノート:編集フィルターにて質問頂けないでしょうか。お手数おかけします。--Sethemhat(会話) 2022年9月13日 (火) 12:21 (UTC)
お詫び
[編集]McYataです。中途半端なところで失踪して1か月以上経ってからのご連絡になりすみません。もう一つお詫びしなければならないのですが、諸事情により、McYataはこのコンテンツ翻訳内の機械翻訳機能の件から降ります。翻訳率以外の方策が必要だと私が説明した相手から「日本語用に翻訳率閾値を設定するための調査に協力してくれ」と言われたあたりから何かおかしいとは思っていたのですが、その後でまさかアレがこんな「些細な」ことのために一個人にああいうことをするとまでは覚悟していませんでした。今後のMcYataは約1年前の状態、つまり単なる記事翻訳・執筆者に戻ります。どなたかが引き続き建設的な方向へ本プロジェクトをまとめ、財団と共に何らかの解決策を見出していってくださるか、Gから始まる奴が変な所にリソース割かずにさっさと機械翻訳をまともなレベルに完成させてくれるのを祈るばかりです。今の私の口からはこの程度のことしか言えないのですが、年明け以来、私が色々やってきた無茶にご協力・ご指導いただいた皆様に心から感謝すると共に、改めてお詫び申し上げます。誠に申し訳ありません。--McYata(会話) 2022年9月4日 (日) 09:36 (UTC)
技術班へ申し入れ以降 (2022-10-25)
[編集]- 報告 意見が出尽くしたと思いますので、mw:Topic:X5np6qyldklnm166にて申し入れを実行してみました。反対されて進む見込みがない時は以前から言っていた制限を課すことを検討しましょう。しかし、そうならないことを切に願っています。--Sethemhat(会話) 2022年10月25日 (火) 11:12 (UTC)
- 報告 (phab:T321819)で「しきい値 75」に変更が完了し「解決済み」とされたようです。短い記事で実際に試して見たところ、Google翻訳にあまり手を加えていない翻訳「78%」は新規ページとして「公開」するのも、個人ページに公開するのも不可能でした。--eWikiLearner(会話) 2022年11月8日 (火) 15:53 (UTC)
- 補足説明をします。@Sethemhatさんからメディアウィキでコンテンツ翻訳拡張機能に関する申し入れをされたところ、UOzurumba (WMF)(言語チーム)という職員の方から機械翻訳との一致度のしきい値75%に調整中であるとの話が出ました。先方からは日本語コミュニティが拡張機能に手を焼いているのは申し訳ないという前置きがあります。
- さて、@EWikiLearnerさんが見つけてくださったファブリケーターという技術作業の連絡板(phab:T321819)の件。10月27日3:37 PM (utc) 時点で前出の言語チーム職員から技術系ボランティアに作業を発注の由。タグから、Language-Team (Language-2022-October-December) (Done)〈言語チームの10-12月期の作業項目であったが完了〉、CX-analytics (Backlog)〈翻訳拡張ツールの分析で遅滞ありだった〉。Referenced Files→None〈経過の添付文書なし〉と読み取れます。
- 以下、わざわざ転記するまでもないかと迷いましたが、事態が一つ前進したのか見切るために、皆さんにご一読を願えないでしょうか。特に★印以下文末まで、「しきい値変更後は日本語版コミュニティが拡張機能を利用した立項を査読評価し件数をチェック」するという段取りだと述べてありますが、これまで協議いただいたことから、外れていないかどうかご確認ください。
- なお転記したものは、いわゆる〈発注内容〉つまり技術的な作業を申し入れる時に、状況説明と何をしてほしいか述べるものです。以下、三角カッコは転記したOmotechoの加筆です。
- 《ここから転記》Content translation applies different limits to control how much machine translation is modified, preventing the publishing of unreviewed initial machine translation.
- This ticket proposes to increase the modification of Machine translation to ensure that translators modify the initial machine translation by 75% in Japanese Wikipedia before publishing the translation.
- The above decision is based on complaint from the Japanese community.
- 《★》Once the above change is made, the community will monitor content published using the Content translation tool to evaluate the quality and number of translations.
- Project〈プロジェクト名〉operations/mediawiki-config
- Subject〈主題〉Set ContentTranslation MT threshold to 75 in Japanese WP〈日本語版ウィキペディア向けには機械翻訳のしきい値は75とする〉
- Customize query in gerrit〈統計のクエリを書き換える〉
- UOzurumba created this task.Thu, Oct 27, 3:37 PM《転記ここまで》
ここからは別件ですので、機会を改めて話題を立てるかもしれません。拡張機能経由で翻訳すると、非常に高率で無出典もしくは出典の少ない記事が立ちます。その点を問題視され、再三、拡張機能利用者に指摘なさる方が対話拒否に遭う事態もたまにいるのですが、もしかして「メタでお勧めしている編集初学者向けの公認の拡張機能」に、こういう恐ろしい落とし穴があるとはどちらも知らされていないのではないか。- 原因はシステムにあり、言語間でテンプレートの引数や構文が非対称な時は、機械的に原文にある出典を削除して訳文に渡さない点は、マシンとしては優秀でも、翻訳の補佐機能としては欠陥です。私Omotechoとしては、閾値よりも原文にある出典テンプレートを拡張機能が剥がして訳文に渡さない点に大きな不満があります。上記の職員に申し述べたのですが、別次元の問題なのか、うまく答えてもらえませんでした。
うまい対策は思い付かないのですが、私の泥縄は「脚注を原文から持ち込まない」とシステムが告げる箇所では、むりやり左窓の原文から脚注を転記します(原文を読みに行くこともある)。
せめてシステムがそのような出典を<nowiki>で包んで訳文に出力するなら、もし翻訳作業者の手に負えなくてそのまま記事名前空間に保存したとしても、少なくとも手がかりが残って日本語版ウィキペディアに立項後に後処理ができるかもしれません。立項の時点では、その部分は出典としては機能しませんが。--Omotecho(会話) 2022年11月9日 (水) 16:38 (UTC)
-
- コンテンツ翻訳機能のトークページにコメントしました。手翻訳の結果さえも一律に機械翻訳の結果と照合して、出力を阻害するのはいかがなものか。
- メディアウィキにて解説文書に該当するヘルプ:コンテンツ翻訳/..../翻訳の品質は英語版原文にローカル版の対応は加筆されないと見込みます。同トークページに「現状を投稿しました。--Omotecho(会話) 2022年11月10日 (木) 09:17 (UTC)
- 結果としてしきい値を75%に引き上げることによってこの件の対処を試みたことは、私の怒りにさらに油を注いだだけに他なりません。理由は以下です。
- Omotechoさんが質問されたように"75%"という値の根拠が不明であり、そもそもen-jaの翻訳に関して知識がない者が適切なしきい値を設定できるとは思えません。日本人が見てOKな文章が75%以上と判断される可能性もあるのです。この判断をしているのは機械ですよね。それは機械翻訳に頼っていることと原理的になにも異なりません。
- 私は「しきい値を設定するのは日本語に関しては無意味」と言ったにも拘わらず"If the above is what you mean, I would like to understand this more because this might be an issue that would need fixing."のような頓珍漢なことを仰る。しきい値がどうかを考えるのではなくそもそも諦めろと私は言っています。ローカルウィキの実際に対処している人間よりも自分たちの判断が勝っていると考えておられるのでしょうか?
- そもそも私は機械翻訳を合意に基づき廃止するように申し入れを行いました。それに対してCX2チームはしきい値を設定することで難を逃れようとしました。クライアントからの要求を恣意的に解釈して対処することを実際の会社で行ったら叱責ものだろうと思います。
- 以上のような内容を向こうにも、後ほどもう少しきつめの言葉で投稿します。これで分かってもらえなければ残念至極ですが、最終手段行使に踏み切る必要があるでしょう。--Sethemhat(会話) 2022年11月11日 (金) 07:09 (UTC)
- コメント 少なくとも箸にも棒にもかからない、トコロテン式の転訳は撲滅され、皆さんの手間がなくなるでしょうか? 技術班が機械翻訳をどうしても使わせたい理由は、システムとしてどこに齟齬があるか理解していないかどうかではない。大口スポンサーつまり私たちが依存する財団のサーバと技術力を支える経済基盤への政治的な配慮?
- 「あなた方技術者が大口スポンサーのAPIのせいで、身内であるはずのコミュニティに責められる苦労もわかる」「機械翻訳を使わないという手段で円満解決だ」とすっとぼけてみたいです。
- 技術者として同情すべき点があるなら、〈他人のフンドシ〉(改変が許されない)から小手先で実績を築き、たなざらし案件が消化できて万々歳ではないかと想像するに至りました。ボランティアで記事を書くのも、コードを整理するのも、どちらも個人のやる気に依存していますから。
- となると、作戦は次元が変わってしまう。相手も言語班あるいは技術班という政治的決定権のない相手は飛び越え、コミュニティ関与部門など、文化格差と包括性へ持ち込むのか。話がまったく通じないので、もう投了で良いと諦めます。12月まで気持ちの整理にあて、ウルトラシーの明暗が降ってくれば幸いだと考えます。--Omotecho(会話) 2022年11月11日 (金) 09:44 (UTC)
- コメント メディアウィキの窓口の方とのコミュニケーションがうまく行っていないように見受けられます。「"If the above is what you mean, I would like to understand this more because this might be an issue that would need fixing."」は、「なぜしきい値の設定ではだめなのか、もっと詳しく知りたい」という意味です。窓口の方自身が、日本語は「字数」の変更でしか「しきい値」を計算していないことをご存じないのではないかという気もします。なかなか、メッセージのやり取りでは難しそうです。チャットでもできれば、もう少し言いたいことを伝えられるかもしれません。--eWikiLearner(会話) 2022年11月11日 (金) 12:48 (UTC)
- @EWikiLearnerさん: 上にあるMcYataさんの投稿にあるように、McYataさんはチャット等ではなく実際に会話をされたようです。それでもなお理解は得られなかったのです。しかも彼は意味深な発言を残して退かれました。私の申し出を勝手にしきい値の話にすり替える時点で怪しさが...でしたので、これ以上善意に取ることは難しかったと思います。今回の私のポストの言葉は強かったかわかりませんが、後は相手次第だと思っています。コンテンツ翻訳自体の禁止など、どのユーザー層まで許容するかなど調整が恐ろしく面倒なことが予想されるため、機械翻訳を禁止することで妥協してほしいと思っています。--Sethemhat(会話) 2022年11月11日 (金) 14:22 (UTC)
- なぜメディアウィキチームがコンテンツ翻訳に固執するのか。これは私の想像でしかありませんが、彼らは技術を生かしてウィキメディア財団全体の理想に貢献することが使命のはずでしょうから、彼らの取り組みを、たとえその一部分であっても否定することは、彼らのウィキメディアグループ内での仕事ぶり、ひいては存在意義を否定することになるからでしょう。私はこのプロジェクトに出入りさせてもらうようになったのがつい最近のことなので、皆様が苦労なさって作って来られた進め方の路線について、色々と言える立場にありません。その上でひとつ心配なのは、Google翻訳の自動取り込みだけを禁止したコンテンツ翻訳は、結局外部のウェブブラウザなりでGoogle翻訳やDeepL翻訳を行って、コピー&ペーストする手法を使う人が出てくるような気がします。少し面倒になる分、機械翻訳のほぼコピーが減るといいのですが。ところで、最近のCX2利用者の上位利用者に関する推移を調べるとこんなことになっていました。--eWikiLearner(会話) 2022年11月11日 (金) 14:59 (UTC)
- @EWikiLearnerさん: 上にあるMcYataさんの投稿にあるように、McYataさんはチャット等ではなく実際に会話をされたようです。それでもなお理解は得られなかったのです。しかも彼は意味深な発言を残して退かれました。私の申し出を勝手にしきい値の話にすり替える時点で怪しさが...でしたので、これ以上善意に取ることは難しかったと思います。今回の私のポストの言葉は強かったかわかりませんが、後は相手次第だと思っています。コンテンツ翻訳自体の禁止など、どのユーザー層まで許容するかなど調整が恐ろしく面倒なことが予想されるため、機械翻訳を禁止することで妥協してほしいと思っています。--Sethemhat(会話) 2022年11月11日 (金) 14:22 (UTC)
- コメント メディアウィキの窓口の方とのコミュニケーションがうまく行っていないように見受けられます。「"If the above is what you mean, I would like to understand this more because this might be an issue that would need fixing."」は、「なぜしきい値の設定ではだめなのか、もっと詳しく知りたい」という意味です。窓口の方自身が、日本語は「字数」の変更でしか「しきい値」を計算していないことをご存じないのではないかという気もします。なかなか、メッセージのやり取りでは難しそうです。チャットでもできれば、もう少し言いたいことを伝えられるかもしれません。--eWikiLearner(会話) 2022年11月11日 (金) 12:48 (UTC)
- 結果としてしきい値を75%に引き上げることによってこの件の対処を試みたことは、私の怒りにさらに油を注いだだけに他なりません。理由は以下です。
- 報告 (phab:T321819)で「しきい値 75」に変更が完了し「解決済み」とされたようです。短い記事で実際に試して見たところ、Google翻訳にあまり手を加えていない翻訳「78%」は新規ページとして「公開」するのも、個人ページに公開するのも不可能でした。--eWikiLearner(会話) 2022年11月8日 (火) 15:53 (UTC)
- 報告 重要な事実に思われますので、すでにご存じの方もいらっしゃると思いますが、このプロジェクトに参加されておられる方(@McYataさん、@Tze Chiang Haoさん、@Open-boxさん、@紅い目の女の子さん、@Junknoteさん、@YellowSmileyFaceさん) +この件に意見をくださった方(@Omotechoさん、@EWikiLearnerさん)すべてに通知申し上げます。
- 上記の話にもありました通り、McYataさん主導による5月ごろからのコンテンツ翻訳 (CX2)チームとの折衝の結果として、10月25日よりメディアウィキの方へコンテンツ翻訳 (CX2)チームへ機械翻訳の廃止の申し入れに踏み切っていました。交渉は非常に、非常に難儀しましたが、およそ一か月たった11月29日、廃止を行うPhabricatorのタスクがチームの方により作成されました。この機械翻訳に制限をかけることは機械翻訳の質が今よりもずっと悪かった2016年ごろから井戸端で議論されていたり、例えば削除の方針の改定が試みられたこともありましたが、機械翻訳自体は2022年新設の削除方針G-3により対処が容易になったものの大本を閉めることはできずにいたと思います。そんな状況の中、皆様にご尽力頂いた結果として機械翻訳の廃止を開発者側に認めさせることができたということは、日本語版の翻訳問題において非常に大きな意義を持つのではないかと考えております(ただし、実際に規制が行われるまでには2週間ほどかかるとのことです)。
- しかしながら、ここでコンテンツ翻訳からの機械翻訳はあらかた規制できるようになりましたが、手動で切り貼りすることは今でも容易な状態です。これを防ぐために翻訳のガイドラインの改定を含むさらなる策を考えていかなければならないと思い策も練っていましたが、一身上の都合(多忙)により私はこれ以上のWikipediaへの参加が難しくなってしまいました。それでも、ファーストステップ(翻訳が行われたことを検知して編集フィルターを作動させ、画面にWP:翻訳のガイドラインを含む各種翻訳関係リンクを表示し、読み込みを促す)の策定は行いたいと思っております。この提案を実行すべきかということも含め、皆様のさらなるお力添えを賜りたいと存じます。これはもう少し練った上で再度提案したいと思います。改めまして皆様お疲れ様でした。--Sethemhat(会話) 2022年11月29日 (火) 11:52 (UTC)
- 補足 今回、廃止するという言質を引き出すことには成功しましたが、開発者たちが機械翻訳の問題点を今だに理解できていないということは問題として残っています。しかし、これからはローカルの話になりますので、高次的なところとはもう話をする必要は発生しないのではないかと思っています。
- ともあれ、どのユーザーに許可するのかなどの複雑な議論手順を踏まなければならないコンテンツ翻訳自体の(一部)禁止を、実行しなくてよくなったことに対して非常にほっとしています。--Sethemhat(会話) 2022年11月29日 (火) 12:01 (UTC)
- @Sethemhatさん、そして関係者皆さん、ありがとうございました。そして、お疲れさまでした。これで機械翻訳を濫用した翻訳記事は減ると思います。
- ただ、機械翻訳を参考程度(単語の意味などの小さなこと)に使用するのは許可すべきだと思っています。この考えにみなさんが賛同されるかは分かりませんが、賛同された場合はWP:MACHINEに「コンテンツ翻訳での機械翻訳機能は、コンテンツ翻訳を使用した低品質な翻訳記事が数多く投稿されたため停止されました。しかし、主に翻訳を自分で行っており、外部サイトの機械翻訳(Google翻訳など)を参考程度(ある単語の意味など)に使う限りは問題ありません。ただ、外部サイトの機械翻訳をコピペしてそのまま投稿するのは絶対におやめください。」などの記述を追加するのが必要かもしれません。--YellowSmileyFace(会話) 2022年11月29日 (火) 13:40 (UTC)
- 追記 以上の考えを共有したのは、MediaWikiの方々も仰られていた通り、機械翻訳機能が廃止されることによって日本語へ記事を翻訳する方の数が減ってしまう、という懸念からです。これを防ぐためにも、参考程度での外部の機械翻訳を使うことを許容することで翻訳者の方々の助けになるのでは、と考えました。--YellowSmileyFace(会話) 2022年11月29日 (火) 13:48 (UTC)
- コメント Sethemhatさん、Omotechoさん、YellowSmileyFaceさん、EWikiLearnerさん、メディアウィキでの交渉ありがとうございました。他言語版の廃止要望で閾値の調整を主導されていた Pau Giner(Pginer-WMF)さんが、機械翻訳廃止のチケットを作成したことには驚き、大きな前進であると感じております。来るべき機械翻訳廃止に向けて、YellowSmileyFaceさんの仰る翻訳者の減少への対策など、色々と準備を進める必要がありそうです。(むしろ本当に2週間で廃止が実施されるのであれば、時間がほとんどありませんね…)--Junknote(会話) 2022年11月29日 (火) 23:24 (UTC)
- コメント しばらくログインしておりませんでした。年始にレビュープロジェクトが始動してから機能廃止が年内決着となったことは驚いていますし、このような結果となったことには素直に喜びたいと思います。これまで交渉にあたってこられたSethemhatさん他の本プロジェクト参加者には頭が下がる思いです。事後追認という形となりますが、改めて御礼申し上げます。--Tze Chiang Hao(会話) 2022年12月11日 (日) 09:25 (UTC)
- 報告 phabのチケットの進捗を確認しておりましたが、機械翻訳機能を無効にするパッチセットが適用されました。私も今CXを試してみましたが、原文転写しかできなくなっているようです。取り急ぎご報告まで。--Junknote(会話) 2022年11月30日 (水) 08:49 (UTC)
- 報告 Wikipedia‐ノート:翻訳のガイドライン#コンテンツ翻訳の機械翻訳廃止に伴う改訂についてにてWP:MACHINEの改訂を提案しました。皆様のご意見をいただければ幸いです。--YellowSmileyFace(会話) 2022年11月30日 (水) 13:14 (UTC)
機械翻訳廃止を周知して頂けませんか
[編集]プロジェクト外から失礼します。今朝(12月1日朝)コンテンツ翻訳を使おうとしたらGoogle翻訳が出来なくなっており、その原因をいろいろ探した挙げ句、最終的にこちらの議論にたどり着きました。メタウィキでの技術チームとのやりとりも拝見した上で、jawikiの「総意」のような形で機械翻訳廃止について強い申し入れが行われて廃止に至ったものと理解しています。ただ、実際に機械翻訳を補助的に活用していた利用者は少なくなく(私もその一人です)、このように影響の大きい仕様変更が行われたのであれば、然るべき内容についてもっと広く周知して頂きたいというお願いに至った次第です。よろしくお願いします。--Bsx(会話) 2022年12月1日 (木) 09:46 (UTC)
- @Bsxさん: 機械翻訳廃止の提案をしました、Sethemhatと申します。機械翻訳機能がいきなり使えなくなっていれば困惑するのは当然と思います。機能無効化の原因を探させてしまったこと、お詫び申し上げます。
- 「然るべき内容」について詳しくお聞かせ願えませんでしょうか。本廃止案件に関しましてはすでにWP:お知らせには記載されていますが、もしさらなる周知が必要だとお考えならば、Sitenoticeで全閲覧者に告知を行うことが可能です。その実行を申し入れた方がよいのでしたらその旨お伝えください。
- 「機械翻訳を補助的に活用していた利用者は少なくない」という件に関してですが、Bsxさんのようにきちんと翻訳を改稿できる利用者ばかりではなく、むしろそうではない人の方が多いです。コンテンツ翻訳で可能な、機械翻訳で作成された訳文から翻訳を行う方式は、機械翻訳が行った誤訳を見過ごす可能性が高い点で、翻訳の質が低くなる可能性が指摘されています。具体的にはコンテンツ翻訳からの翻訳の約半数が許容できないレベルの日本語であることが判明しています(参考)。この件ではご迷惑をおかけしておりますが、ご自身で適切な対処頂けませんか。また、機械翻訳は参考程度の使用ならば許容されることを明示する翻訳のガイドラインの改定を現在行っておりますので、今しばらくお待ちください。--Sethemhat(会話) 2022年12月1日 (木) 10:07 (UTC)
- @Sethemhatさん:端的に言えば「Sitenoticeでの周知」を希望するところです。私はWikipediaを使用するにブックマークをメインページ以外の所にしており、WP:お知らせが目につかないというユーザーも少なくないのではないかと推測しています(少数派かも知れませんが)。Sitenoticeでの周知を行えば、そういったユーザーにも目に届くと思われます。ご検討をお願いします。--Bsx(会話) 2022年12月1日 (木) 11:08 (UTC)
- 返信 お知らせで告知されたことはほとんどのユーザーは確かに知らないと思いますので、Sitenoticeでの告知に私は賛成します。Sitenoticeを使用する可能性があるとのことで、MediaWiki‐ノート:Sitenotice#コンテンツ翻訳内の機械翻訳機能廃止に関する告知 にて議論が行われていることを告知しました。以下に文案を作成しましたが、文案の改善やSitenotice以外の告知方法がよい、またはその他の意見あれば皆様より頂きたく存じます。
--Sethemhat(会話) 2022年12月1日 (木) 11:30 (UTC)
- 横から失礼 コンテンツ翻訳の機械翻訳廃止の経緯を解説するページを作成しましたので、「【お知らせ】プロジェクト:翻訳検証で行われた議論により、「コンテンツ翻訳ツール」内の機械翻訳機能は廃止されました。詳細はプロジェクト:翻訳検証/コンテンツ翻訳の機械翻訳廃止についてを御覧ください」のような感じでSitenoticeからリンクしていただければと思います。--YellowSmileyFace(会話) 2022年12月1日 (木) 19:40 (UTC) 例を追加--YellowSmileyFace(会話) 2022年12月2日 (金) 02:05 (UTC)
- 「一斉通知」はこういう使い方が適すると感じます。申請トークページで管理者に依頼する手順でしたね。見てきます。
- @Bsxさんの迅速なお問い合わせ・ご提案と@Sethemhatさんのご確認・進行、@YellowSmileyFaceさんのご対応、誠にありがとうございます。--Omotecho(会話) 2022年12月2日 (金) 04:56 (UTC)
- 横から失礼 コンテンツ翻訳の機械翻訳廃止の経緯を解説するページを作成しましたので、「【お知らせ】プロジェクト:翻訳検証で行われた議論により、「コンテンツ翻訳ツール」内の機械翻訳機能は廃止されました。詳細はプロジェクト:翻訳検証/コンテンツ翻訳の機械翻訳廃止についてを御覧ください」のような感じでSitenoticeからリンクしていただければと思います。--YellowSmileyFace(会話) 2022年12月1日 (木) 19:40 (UTC) 例を追加--YellowSmileyFace(会話) 2022年12月2日 (金) 02:05 (UTC)
- @Sethemhatさん:端的に言えば「Sitenoticeでの周知」を希望するところです。私はWikipediaを使用するにブックマークをメインページ以外の所にしており、WP:お知らせが目につかないというユーザーも少なくないのではないかと推測しています(少数派かも知れませんが)。Sitenoticeでの周知を行えば、そういったユーザーにも目に届くと思われます。ご検討をお願いします。--Bsx(会話) 2022年12月1日 (木) 11:08 (UTC)
- 提案 異論が無いようなので明日か明後日にも「【お知らせ】プロジェクト:翻訳検証で行われた議論により、「コンテンツ翻訳ツール」内の機械翻訳機能は廃止されました。詳細はプロジェクト:翻訳検証/コンテンツ翻訳の機械翻訳廃止についてを御覧ください」の文面でSitenoticeの依頼をしようと思います。一応異論がないか確認するため、議論に関わられた@Bsxさん、@Sethemhatさん及び@Omotechoさんに通知を入れさせていただきます。--YellowSmileyFace(会話) 2022年12月3日 (土) 17:11 (UTC)
- YellowSmileyFaceさんの最終文面で異論ありません。ただ、リンク先の解説文書は直す余地があるのではないかと思います。--Sethemhat(会話) 2022年12月3日 (土) 22:57 (UTC)
- 解説文書について、同意です。この件に後の方から参加した自分が土台として作った程度なので。経緯を説明しようとしたらあんな文章になってしまいました。やはり長い文章が苦手な自分には無理ですね...どなたかが直してくださることを期待します。--YellowSmileyFace(会話) 2022年12月4日 (日) 00:06 (UTC)
- YellowSmileyFaceさんの最終文面で異論ありません。ただ、リンク先の解説文書は直す余地があるのではないかと思います。--Sethemhat(会話) 2022年12月3日 (土) 22:57 (UTC)
- なお参照先ページが最終稿・決定稿ではないとテンプレートで(メディアウィキのコンテンツ翻訳ツール解説ページに)示す方法を探してみます。翻訳ページのため加筆できないので管理者に依頼するか、ノートページへ誘導か。
示してきます(ウィキペディアの「工事中」相当のテンプレートはないのでしょうかね)。
- なお参照先ページが最終稿・決定稿ではないとテンプレートで(メディアウィキのコンテンツ翻訳ツール解説ページに)示す方法を探してみます。翻訳ページのため加筆できないので管理者に依頼するか、ノートページへ誘導か。
- 補足:以下はリンク元に加筆し、いったんコメントアウト。編集が競合した場合は乞ご容赦。
== 外部リンク ==
- コンテンツ翻訳ツール メディアウィキの機能解説ページ
- CX2拡張機能を使った・使わない翻訳記事の件数(折線グラフ) 全言語版対象、期間と属性を指定して比較。たとえば [2022-11-01]〜[2022-12-01] + [機械翻訳エンジン] など。ウィキメディア技術班Dashiki作成(クリエイティブ・コモンズ・ライセンス CC0)
- ウィキメディア財団の見解 公式ブログ→「translate」で絞り込み。(クリエイティブ・コモンズ・ライセンス帰属-同一条件許諾 3.0 Unported license)
- --Omotecho(会話) 2022年12月4日 (日) 05:49 (UTC) 下線部を追加。/ --Omotecho(会話) 2022年12月4日 (日) 04:34 (UTC)
- 文章を改稿してみました。概略の理解に大きな問題はないと思います。さらなる加筆も自由にお願いします。おまけで年表的なものも付けましたが、私は2021年以前の議論はあまり存じませんので不要なものがあったりや逆に必要なものが欠けていたりした場合はこれも適宜編集をお願いします。Omotechoさんが外部リンクを加筆されるならばそれもお願いしたいと思います。
- sitenoticeについては早ければ早いほどよいと思います。掲示期間は2週間ほどでよいでしょうか。--Sethemhat(会話) 2022年12月4日 (日) 07:18 (UTC)
- コメント sitenoticeについては「遅すぎる」と感じているくらいですので、速やかに対応頂ければと思います。
- それと余談ですが、「一件落着ではないのでは? いずれ、拡張機能としての充実・修正に合議が待たれます。しかしタイミングはいつかですよねぇ」とのOmotechoさんのコメントにはちょっとだけ違和感を覚えました。MetaWikiの技術チームとのやりとりを見る限り、先方は自動翻訳機能を活用してコンテンツ翻訳の利用を促したいように見えたのですが、今回の申し出で「jawikiが自動翻訳機能そのものを拒絶している」ように映ったのです。そうなると、拡張機能としての充実・修正はMetaWikiの技術チーム的に「もうありえない(自動翻訳機能を組み込むこと自体がjawikiに受け入れられない)」という風に解釈しているのでは…?と懸念を覚えたところです。--Bsx(会話) 2022年12月4日 (日) 09:39 (UTC)
- @Bsxさん冒頭でご指摘の点、コンテンツ翻訳拡張機能(以下CX2)に機械翻訳を組み込まない不利益があるのですよね(後述)。私の先般の「まだ収束ではない」というコメントは、機械翻訳という蛇口を閉めた後も、百科事典の品質を下げる記事は残り、それにどう対処したら良いのか。機械翻訳の研究が進んだ英日という言語のペアであるからこそ、言語班はその組み込みに関して、おいそれとあきらめまいと考えます。そうなら交渉できる。今回、先方は機械翻訳の出力結果とのマッチング率を発動させた(過年度の未消化案件をクリアしようとした)のを、1回失敗しただけですし。(というような獲らぬ狸の皮算用はSethemhatさんが警戒しておられます。)
- 議題は応用篇になるけれども、それを考えると、ジナーさん(PGiner_(WMF) )の最後の投稿は社交辞令ではなく、前向きな申し出だと解釈します。議論が熱いうちに、後始末に何かツールで協力してもらえないかと話を進める可能性を捨てるかどうか。CX2由来で量産型された低質な記事はまだ大量にあるから校閲を人海戦術であたると消耗するし、この作業は、ある程度は機械化できないものでしょうか?
- 以下はすでに検証を積んできた皆さんの作業を翻案したのみです。もちろんローカルの管理者や技術に詳しい方のご助言を仰ぎたいですし、火元はCX2なので、因果関係としては向こうに負うべきものはある。
- 例:利用者1件が200超の低質な記事を立てた。
- 問題の分析=
- 立項を受け、他の編集者の努力により質があがったもの、
- 出鱈目な自作の文が多く、編集するよりも削除した方が効率が良いもの、
- 機械翻訳のところてん式の出力で、しかも特性が手付かずで残っている。その場合は、
- 修正が必要な箇所を機械的に処理しておき、
- 一群の「翻訳直後」記事として扱えるようにする。
- ただ、機械的に処理できるかどうかの見極め、そのための共通理解を言語をまたいで取り付けたりなど、正直、腰が引けています。
------ 後述の部分です。
- 質問ですが、編集作業中に、段落単位程度の文字量を機械翻訳で確かめ、ご自分の訳文のチェックにたい。そういうCX2の使い方は想定できませんでした。そのニーズに応える、小さなガジェットがあればお役に立ちますか?
- 蛇足。あくまでも後知恵ですが、当初、別案を提案しました。
- コンテンツ翻訳拡張機能の作業結果保存先は、既定で個人のサンドボックス[利用者:username/下書き]限定する。経験値は度外視。
- 同出力を直接、標準名前空間(記事名前空間)に出稿できる利用者層を絞りこむ。目安は生涯投稿回数≒。
- 機械翻訳をどの程度、やっかいな機能と評価するか……。先週末にAAMTの発表会があり、公設の研究機関から中間発表がありました。題材は「みんなの翻訳」でしたが、エンドユーザの使用感を拾ったようです。私感ながら、ごっそりと文の要素をおとすディープルに寄せる懸念も聞かれました。--Omotecho(会話) 2022年12月6日 (火) 00:03 (UTC)
- @Omotechoさんのお考えは判りましたが、残念ながら今回jawikiにおいて「コンテンツ翻訳における自動翻訳の全面拒絶」という最もお手軽かつハードランディングな方向性で決着してしまった以上、その先のステップは「事実上消滅した」と考えています。状況が変わるとしても年単位で先の話になるでしょう(皆さんの「次」に向かうモチベーションがだだ下がりなのも容易に想像がつきます)。他言語版で「自動翻訳機能が使える利用者の条件設定」などのソフトランディングで決着したのを見るにつけ、返す返すも残念に思います。--Bsx(会話) 2022年12月6日 (火) 22:16 (UTC)
- コメント 文面についてだけ。sitenoticeはお知らせであることが自明なので、わざわざ【お知らせ】とつけたことは過去の例にもありませんし、とても違和感を覚えます。個人的感覚ではその「お知らせ」というヘッダーがなければとりあえずは許容できると思いますが、お知らせメッセージが出てからだと「なんだこれ」と言われてしまうので、改めて異質すぎないように変更してもらえませんか。過去にどんな形でお知らせされていたかはページの履歴を見れば分かるはずですし、それらを参考にしてもらえれば良いと思います。--青子守歌(会話/履歴) 2022年12月4日 (日) 10:19 (UTC)
- @青子守歌さん: では、「【お知らせ】」を除去した文面を暫定最終案としましょう。
- @Bsxさん: 我々の認識では、先方が2週間以内に対応されるとのことでしたからほぼ即時の実装は予想外であったということだけ申しておきます。Omotechoさんによるリンク追加が終わればすぐにでもSitenoticeの編集を申し入れる予定です。
- 前から開発元とのやり取りのことで皆様に意見申し上げたかったのですが、失念していました。Bsxさんのお言葉で思い出すことができましたのでこの機会に、ついでに述べます。まず、Bsxさんのご認識は正しく、こちらは再度有効にするという合意が形成されない限り二度とコンテンツ翻訳内の自動翻訳機能を有効にすることはありません。ですから、閾値調整のために開発元が行っている英語・日本語訳文の対照作業を行う必要が消滅しています。そもそもこちらが機能を廃止しろと言っているのにそれに直接返答せず、向こうは論点をそらし閾値の設定を勝手にやったり、私の閾値設定は無意味であるという批判に回答しないようにして、閾値設定につながる自動翻訳と人力翻訳の対照作業を行いたいと言っていたり非常におかしい交渉でした(私は日本語を解しない者が閾値調整を行っていることに対してそもそも強く反対してもいます)。それに協力しても今は無意味ですからしないようにお願いしたいです。--Sethemhat(会話) 2022年12月4日 (日) 10:37 (UTC)
- @Sethemhatさん:もう「今更」感しかないので個人的感想でしかないのですが、そもそも自動翻訳機能の廃止を、いつの間にか「jawikiの総意」という形でMetaWikiに申し入れを行っていること自体に強い違和感を覚えています。Sethemhatさんのお考えは理解できますが、コンテンツ翻訳における重要な機能の一つであり(MetaWikiの技術チームが強く抵抗したのもそれでしょう)、コンテンツ翻訳の機能自体を事実上無効化するに等しい手続きの検討について広く意見を募った形跡もなく(少なくとも、私は自動翻訳機能の廃止が行われるまで今回の議論を全く知りませんでした)、MetaWikiの技術チームとのやりとりにおいてもSethemhatさんの強硬姿勢ばかり目についたというのが正直な印象です。--Bsx(会話) 2022年12月4日 (日) 14:14 (UTC)
- 返信 (Bsxさん宛) : 落ち着きましたので返信致します。以下はOmotechoさんへのBsxさんからの返信に対する、私のコメントも含みます。
- まず、「広く意見を募った形跡」があまり見られないことは私の議論進行の不手際です。関連議論は井戸端にて数回行っており、そこですでに廃止に動いていることは認められるためコメント依頼に掲載したのとほぼ同じ周知度があったかと思いますが、コメント依頼に掲載していなかったことは事実ですからこの点でお詫び申し上げます。
- 次に、機械翻訳機能廃止の妥当性について。機械翻訳は折り曲げナイフのようなものです。普段はその刃は収納されていますが、いざとなると牙をむきます。すなわち、普段使いならば問題ないですが、正確性が求められるウィキペディアにおいては誤訳はよろしくないものです。人力で翻訳していればミスしてしまうこともあるでしょう。しかしそれは原文を確認してもなおミスしてしまうものですから、仕方のないものとして割り切ることができます。しかしながら、機械翻訳の文章をちょっと修正で公開して例えば(機械翻訳がよく間違える)専門用語などでミスをしてしまったならば、それは機械翻訳に責任を擦り付けることはとてもできず利用した者の責任になります。ここで、この責任を放棄する(というか刃物の危なさを知らずに遊ぶ)者が(結構)現れます(例: 1, 2, 3, 4, 5)。要するに刃物の悪用です。そうなると、いくら善良な用途に使っている者がいても仕方なしに禁止しなければならないのは当然のことです。
- それから、なぜ妥協策ではなく廃止を要求したのかについて。
- 「強硬姿勢」に関しては、これ以外に道はありませんでした。もし他にやさしい姿勢でも廃止をもぎ取れる方がおられるのでしたら、それは私の能力不足ということになります。過去に同様に、アラビア語版(門前払い)やベトナム語版(一個緩い条件で妥協)を見ていれば生半可な覚悟では議論に望めないのは分かっていましたし、事前に他のPJ参加者が会話を行ったときも向こうはこちらの主張を理解しようとしないかできないということが判明していました。私が最初に「廃止してくれなければローカルで対処します」と言っていれば正しい対応は、「1、素直に従う」「2、なぜ廃止に踏み切ったのかについて詳しく話を聞く」の二択でしょう。断じて、こちらが頼んでもいないのに勝手に閾値を下げて「してあげたから問題があったら言ってください」のような態度をとることではない筈です。この時点で第一の論点のすり替えが行われ、この態度は次の「翻訳レビュー」の要請においても踏襲されます。最初の態度は決して柔らかいものではありませんでしたが、その後に私の態度をさらに硬化させたのは度重なる論点のすり替えと指摘に全く答えない態度です。
- 「お手軽かつハードランディング」に関しては、上記に申したように最初から柔らかい態度で言ったらずるずる問題が格下げになるので、持てる一番厳しい条件で臨むのは一つの交渉法です。ただし、私が強硬手段を取ったからと言って私がそういう人間であるとは誤解しないで頂きたいです。穏当に行けば目的の条件が引き出せないからやむを得ずこうしているまでです。実際、最高条件で行ったにも拘わらず失敗したかと思いました(その点でもpginerさんの申し出は驚愕に近いものでした)。上に挙げた刃物の例で例えますと、ライセンス発行をすることにより使用を許可することができましょう。しかし、WikipediaにおいてPJ参加者が他利用者を審査することに抵抗を感じますし、手間もかかります。そんなに多くのリソースを割いてはいられません。
- --Sethemhat(会話) 2022年12月7日 (水) 06:34 (UTC)追記--Sethemhat(会話) 2022年12月7日 (水) 06:49 (UTC)
- 返信 (Sethemhatさん宛) コメントありがとうございます。が、残念ながら、コメントを読ませて頂くにつけ、ここでの議論も、MetaWikiの技術チームとのやりとりも含めて、結果的に「機械翻訳機能の廃止」がプロジェクトの目的化してしまっているのがなんだかなぁ、との印象を強くしたというのが正直なところです。いみじくも、Sethemhatさんが刃物を持たない運動の例を挙げていらっしゃいますが、そうした急進的な運動の結末がどういったハレーションをもたらしたのかについては一切無視されるのでしょうね。
- 今般、コンテンツ翻訳における機械翻訳機能の廃止で、他言語版からjawikiへの翻訳を試みようとする人も件数も桁単位で減少することは避けられないでしょうし(このことは恐らくは皆様が最も望んでいたことなのでしょう)、それでもなんとか翻訳を試みる人は「Google 翻訳のコピペ」での記事作成を試みるでしょうから、そもそもこのプロジェクトの発端となったであろう「日本語版へ質の低い翻訳記事が移入される」という問題の根本的な解決には至らないんじゃないかな、とは思っています。尤も、これ以上私が何を申し上げても、「機械翻訳機能の廃止」という結論が出て実行されてしまっている以上は「感想戦」の域を出ませんし、私個人は機械翻訳機能の復活に向けて無駄なリソースを割くつもりもない(ここにいらっしゃる皆様が全力で反対に回ることは容易に想像できます)ので、私の個人的感想はこのくらいにさせて頂きます。ありがとうございました。--Bsx(会話) 2022年12月7日 (水) 09:34 (UTC)
- 返信 (Bsxさん宛) 真摯な批判は何事にも代えがたいものです。その点で、今回の反対派のBsxさんのご意見は非常に貴重なものと私は考えています。当たり前ですが、私は正常に議論される方に対しては真剣に向き合って返答を返しております。このことを明確にしつつ考えますと、すべての意見の中身が何であれ、そう思っている人が存在することはある程度考慮しなければならない点となりましょう。
- ただし、私たちPJ:翻訳検証の目的は根本的に、悪い品質の記事を減らすことにあります。私の勝手な意見ですが、機械翻訳が使えないことで翻訳をあきらめるということは編集が機械翻訳に依存して(しまって)いるということであり、それはWP:DP#G-3で禁止していることそのものです。
- 「日本語版へ質の低い翻訳記事が移入される」問題に関しましては、編集フィルターでの事前お知らせを含め地道に対処方法を考えてまいりたいと考えています。改めて、この度一般利用者の方々へ廃止のお知らせをするべきだと勧告頂いたことを含む、数々の貴重なご意見に対し御礼申し上げます。--Sethemhat(会話) 2022年12月7日 (水) 09:53 (UTC)
- 返信 (Sethemhatさん宛) 先程のコメントで止めにしようと思っていたのですが、先ほどのお返事を含め、当初からの議論をずらっと見るにつけ、一つだけ思い違いをなさっているのでは無いか(そしてそのままの認識のまま今後プロジェクトが進められていくのではないか)との懸念を覚えましたので、蛇足かつ長文になりますが、老婆心ながら申し上げておきます。
- 「翻訳検証の目的は根本的に、悪い品質の記事を減らすことにある」とのことですが、ここまでのみなさまの認識は「日本語文法的に」悪い品質の記事を減らすことに注力されておられるのだろうと思われます。しかし、そもそも他言語版から翻訳を試みようとする方は、翻訳を生業とするような美しい日本語の書けるバイリンガルの方ばかりとは限りませんし、むしろそうでは無い、言い換えれば言語知識はさほどではなくともその記事の分野に関して関心が強い、あるいは専門的な知見がある方のことが多いだろうと考えています(そして、どちらかといえば私もこちらになるだろうと思います)。
- そう考えた場合、「日本語として美しい」かもしれないが「専門的知見からすれば誤謬がある」翻訳というのは往々として生じるわけで、むしろ「日本語としては辿々しい」が「専門的な知見に関しては正しく理解されている」翻訳も考えられると思います。その際、前者と後者を比較して、どちらがWikipediaの記事として「品質として優れている」かを考えると、必ずしも前者の方が優れているとは言い難いと考えます。
- 今回の措置で、後者の(日本語としての品質に劣る)翻訳は悉く排除されることになるだろうと思いますが、そのことを持って悪い品質の記事が減ると言えるのかどうか、むしろ「日本語としては美しいが内容に事実誤認の多い」翻訳ばかりにならないか(そもそも翻訳記事の絶対数自体が激減するだろうと考えているのは先に述べたとおりですが)との懸念があることを皆様にお伝えしておきたいと思います。失礼いたしました。--Bsx(会話) 2022年12月8日 (木) 04:08 (UTC)
- @Bsxさん お久しぶりです。最近はほとんど顔を出せていないながらコメントさせていただくことご容赦ください。Bsxさんのコメントのうち、「「日本語文法的に」悪い品質の記事を減らすことに注力されておられる」という部分には誤解がありそうだということを指摘させていただければと思います。
- 確かに一昔前までの機械翻訳ツールは、日本語への翻訳は特に文法レベルでの致命的な誤訳や文章の崩れが見られるものでした。一方で近年は技術の進展により状況が変わってきており、そういった文法的な部分についてはかなりの改善が見られてきています。また、最近主流になっている言語モデルの構造的な特徴故に、全体的な文脈としては自然な文章になるような出力をするものが増えています。しかしその結果として、原文のうち1文を丸ごと無視するような「訳抜け」といった現象が発生したり、自然さをとるあまり原文と文意が変わってしまうような出力がなされることもあります。すなわち、最近の翻訳ツールは、Bsxさんの表現をお借りするならば「「日本語として美しい」かもしれないが「専門的知見からすれば誤謬がある」翻訳」を生成することが多いのです。このあたりのことは、削除の方針のG-3を導入する議論の際にも、述べたことがあります。
- 当然、悪い品質の記事には日本語としての品質が低いものも含まれますが、コンテンツ翻訳の機械翻訳機能廃止に向けた一連の動きは、どちらかというとBsxさんも懸念されている内容そのものに誤りが多い翻訳記事を減らすことを目的とした手段として検討されてきたものだという認識は、共有させていただければと思います。(むろん、その目的を実現するための手段が「コンテンツ翻訳からの機械翻訳の排除」で果たしてよいのか、という主張があることは、当然だと思います) --紅い目の女の子(会話/履歴) 2022年12月14日 (水) 03:24 (UTC)
- @紅い目の女の子さん、ご無沙汰しております。レスポンスをいただいていたのは把握していたのですが、お返事が遅くなりました。
- いわゆる「訳抜け」に関しては個人的にはほぼ気にしていない、というか、前後とのつながりを考慮して敢えて特定の一文を飛ばす翻訳を行うことは個人としてもあります。私個人としては、英語と日本語のニュアンスの伝え方の違いを考慮すれば、蛇足になりがちな文章は無理に訳さなくてもいいのではないかという判断があるのですが、これを「質の低い翻訳」とみなすかどうかは個人の判断になるのかなと考えるところです。
- いずれにしても、皆様のご尽力のおかげで機械翻訳機能の全面廃止を達成されたことで、コンテンツ翻訳機能が事実上無効化したに等しい(MetaWikiとのやりとりで「コンテンツ翻訳機能自体を否定するつもりはない」との発言がありましたが、私的には詭弁にしか映らないというのが正直なところです)わけで、いっそ「コンテンツ翻訳」へのリンクも廃止してもらったら?とすら思うところです。--Bsx(会話) 2022年12月23日 (金) 03:55 (UTC)
- 機械翻訳を使える経歴からみれば、「訳抜け」は英語〜日本語、および英語を中間言語として使用される日本語〜他の言語ペアで比較的普通であることがわかった。この「訳抜け」が原因で訳文の意味が変わってしまい、翻訳結果が正しくないという状況も目の当たりにしました。ただし、機械翻訳を行う際に編集者が元の文字に注意を払う限り、編集階段でこの問題を修正することは可能です。そして、英語など他の言語を中間言語として使用されない、特定の言語ペアをために専用の資料を使用してトレーニングする機械翻訳ソフトでは、韓国語〜日本語、中国語〜日本語など特定な言語ペアの場合、この「訳抜け」問題は比較的珍しいように見えます。
- 翻訳をチェックする編集者の数が少なくない問題について、Template editorのような利用者グループを作成し、翻訳中に校正を行うことを保証しと証明した編集者にのみ機械翻訳を使える権利を与えることは可能ですか?--C933103(会話) 2022年12月24日 (土) 18:12 (UTC)
- コメント 正直、このページでの議論についてはリンク元のページで説明しているので、「プロジェクト:翻訳検証で行われた議論により、」の部分はいらない気がします。--YellowSmileyFace(会話) 2022年12月4日 (日) 13:17 (UTC)
- 報告 早急な告知が求められていることを鑑み、Wikipedia:管理者伝言板/保護ページ編集にてSitenoticeでの告知を依頼しました。--YellowSmileyFace(会話) 2022年12月4日 (日) 21:51 (UTC)
- 提案 告知から2週間以上経ったことですし、そろそろ告知を除去することを提案します。--YellowSmileyFace(会話) 2022年12月23日 (金) 02:09 (UTC)
- 異論ありません。--Sethemhat(会話) 2022年12月23日 (金) 03:06 (UTC)
- 提案 告知から2週間以上経ったことですし、そろそろ告知を除去することを提案します。--YellowSmileyFace(会話) 2022年12月23日 (金) 02:09 (UTC)
新規参加者向けのシステム試作 (情報)
[編集]新規参加者がごく初期段階の初学者であるときに、やる気の刺激と忠告をバランスさせる対応策が試作中のようです。
- 担当の「Growth」チームとは、経験値に関わらず編集者としてハウツーを深める対策をしてツールを開発、解説文書を書いています。(Growthって成長?深化?)
- 現場はメディアウィキという、ウィキペディアを含むウィキ群に備える機能を扱う空間です。
- いずれ、ウィキメディア財団のウィキに展開する運びと予測します。
なお、翻訳途中のため見通しが悪い状態だとお断りしておきます。--Omotecho(会話) 2022年12月2日 (金) 04:48 (UTC)
- はじめまして。あちらではドラフト名前空間も活用されていますね(en:Category:Draft_articlesにある記事)。メイン空間にドラフト記事の存在が示されて(例:日本の織物)初学者のやる気の刺激にもなるのかなと思います。削除すべき点がある記事も削除の前にドラフト名前空間に移動されることがあります。この手順は導入されるなら賛成です。 --JOT news(会話) 2022年12月16日 (金) 04:49 (UTC) (リンク訂正しました)
特定の許可されたユーザーにコンテンツ翻訳内機械翻訳の使用を許可すべきか
[編集]経緯はMediawikiの方をご覧になって頂ければ分かると思いますが、Doc Jamesさんと言う方が表題の通りのことを要求されておられます。しかし、この要求はすでに他の方も指摘されている通り、ユーザーを「許可」するためのリソースを無視したものです(こちらの懸念に対して向こうが何も応じないのがいやな予感はしますが)。この提案を実行するにあたり私は他にも二つ懸念を持っています。一つは、「一人を許可すれば我も我もと要求が殺到し、相当数の編集者のリクエストを審査しなければならなくなる」ということ。二つ目は、「機械翻訳の安易な利用を禁止しているという現行の制限に綻びが生じる」ということです。それに、ご存じの通り別に外部の機械翻訳をコピペすることは今でも技術的に可能なのです。これに関して、表題の要求を実行すべきかについて一度日本語で皆様の意見を伺っておきたく提起致しました。--Sethemhat(会話) 2022年12月24日 (土) 03:53 (UTC)
- 今回のリクエストは、meta:Wiki_Project_Med(MDWiki)に参加する特定の利用者に限定した話であるという前提で私は考えています。医療という分野が重要だというだけでなく、このプロジェクトは実名による個人登録の申請と許可を得たユーザーであるという点で、ウィキペディアの通常の利用者とは大きく異なります。
- とはいえ、「特権は欲しい。だが他の問題には協力できない」という姿勢では、特別扱いはできません。協力は強制ではありませんし、先方にもできない事情があるでしょう。その場合は、他の一般利用者と同じ土俵で活動してくださいというほかありません。
- MDWikiの望みを実現する手段はいくつかあります。
- ひとつは、ウィキペディアから医療・医学カテゴリを切り出し、多言語の記事をMDWikiでホストする方法。MDWiki自身が音頭をとってWMFに働きかけ、これを実現するのであれば、私は個人的には反対しません。MDWikiでホストされる記事に機械翻訳が使われようが使われまいが、MDWikiの自由です。
- もうひとつは、これまでどおりウィキペディアが医療・医学の記事をホストするが、記事の投稿は翻訳・日本語の書き起こしにかかわらず、すべてドラフト空間への保存とし、MDWikiのメンバーが内容の確認を行ったもののみ公開する方法。MDWikiのメンバーには機械翻訳の使用が認められるが、その場合でも記事の公開にはメンバー同士のピアレビューを必要とする。MDWikiに未登録のユーザーが投稿する記事は、MDWikiメンバーが確認しない限りは未公開のドラフトとして留め置かれるものとする。このシステムのもと、MDWikiのメンバーにレビューは「お願い」するが、「強制」ではない。レビューされなければ、記事が公開されないにすぎない。したがって、医療記事を作成したい利用者には、積極的にMDWikiに登録し、医療分野の記事品質に貢献していただけるよう促す。
- 私が一番避けたいのは、私のような医療分野の素人が海外の医師の方に「先生、この記事どうなんでしょう?」と尋ねてから初めて問題が修正されるような記事が野放しで投稿される事態です。こうした現状の解消に向けた活動を手伝ってもらえるのなら、MDWikiの先生方にも協力はしますが、先方が自分たちの「特権」を求めるのみであれば、答えは「ノー」です。--eWikiLearner(会話) 2022年12月24日 (土) 14:39 (UTC)
- コメント Mediawikiの方でも指摘しましたが、MDWikiの参加者に機械翻訳を許可したら他の方々にも許可しないといけなくなる可能性が高いです。そうなると機械翻訳機能を全員に復活させるか、相当数の利用者の投稿記録を審査する必要が出てきます。前者を実行すれば低品質な機械翻訳記事の量産がまた増えるでしょうし、後者は実行するにしろJawpの利用者に労力をかけてしまいます。巻き戻し者などのように機械翻訳を使える権限などを新しく作ることも出来ますが、あまり現実的ではないでしょう。@EWikiLearnerさんさんのMDWikiの参加者は「実名による個人登録の申請と許可を得たユーザーであるという点で、ウィキペディアの通常の利用者とは大きく異な」るという指摘も御尤ですが、特定の利用者にだけ機械翻訳を許可する以上、「MDWikiの利用者だけ機械翻訳を使えるなんてずるい」という意見が出るのは火を見るより明らかでしょう。現状では先方に外部の翻訳サイトを使っていただくのがベストではないでしょうか。--YellowSmileyFace(会話) 2023年1月4日 (水) 00:17 (UTC)
- コメント@YellowSmileyFaceさん、こちらとMediaWikiの両方にご意見を投稿いただき、ありがとうございました。
- 大量のポストエディットを行いたいのでなければ、「コンテンツ翻訳」内でGoogle翻訳が使えないのは、実は大した問題はないとMDWikiの先生もお気づきになったのではないかと思います。私の希望としては、医学、医療、医薬分野の翻訳記事の品質向上にご協力いただきたかったわけですが、その点は「今は無理なので、そのうちいつか」というだけで歩み寄りはなかったので、致し方ありません。私はMDWikiの立場を代弁するつもりはありません。もし、仮にですが、今後また先方が改めて特別の扱いを求めて来るようであれば、MDWikiから日本代表を立ててもらい、ウィキペディア日本語版のコミュニティと日本語でディスカッションしてもらうよう伝えていいと思います。--eWikiLearner(会話) 2023年1月7日 (土) 17:13 (UTC)
- コメント ここ数年まともに参加できなくて申し訳ない。謝辞を書こうとしたらこの件が目に入ったのでこちらに書きますと、「MDWikiの独自サイト」という選択肢があることもあり、明確に拒絶すべきと考えます。「機械翻訳で済ませたい人が英語版を勝手に読めばいい、日本語版に自力で直して投稿するなら許容される」という扱いから「コンテンツ翻訳の機械翻訳」を復活させる理由はありません。既に先方にはeWikiLearnerさんが説明済みですが、「コンテンツ翻訳の機械翻訳」は日本語版に対して負の影響を発生させます。平たい話、「コンテンツ翻訳を経由しなければ機械翻訳が使えない」程度の技量ではすりあわせすら出来ないでしょう。さらに悪いことにこの要求を認めれば、次に起きることは、「誤訳が危険な医療分野に認めたんだから機械翻訳を無制限で開放してもいいじゃないか(話も聞かずに開放すらあり得ます)」でしょう。機械翻訳を強制したい財団にのしを付けて差し出すようなものです。
- Mediawikiの方も読みましたが、元より先方は特権狙いで、その手前として一切の機械翻訳解禁を求めていると考えます(初歩的な「ドア・イン・ザ・フェイス」戦術です)。この種の方に初手で「医学は機械翻訳に適している分野の一つ」なんてやらかしたら、ごねたら確実に折れる、押し込むまでと判断するでしょう。典型的な「紳士的な姿勢を弱みと受け取られる」ケースであると判断しました(ただ、私はこの方の過去のケースを目にしたことがあり譲ってはならないタイプと判断しているからこそノータイムで全面戦争を選択するので、それを他の方に求めるのは無理かなと)。eWikiLearnerさんの説明を受け入れてもらえるならいいのですが。
- 純粋に技術的な面からは逆方向に走ってますね。誤訳防止ですと内容の高品質化よりもシンプルに、誤解されないようにする方が重要なのですが、高品質化で問題が解決できると誤解しているようです。残念ながら複雑な構文は、機械翻訳と相性が悪いです。そしてライセンスの衝突を理解していないのはかなりまずいです。SAが無条件で他のライセンスを上書きできると思ってるっぽい……。これに比べたら、日本語版のAI絡んだら一切の著作権、ライセンスを否認する方向性ですらまともな部類です(こちらもDeepLの挙動(ユーザー入力による訂正を取り込んでしまって異常な訳を返す)や最近増えてきたGoogleの挙動(DeepLに特徴的であった文単位での翻訳省略が発生している)から根拠である依拠性の否定が怪しくなってきてはいるんですが)。
- 補足的ですが、個人的にはMDWikiというよりDoc Jamesさんを信用していません。これは、珍訳と履歴不継承を指摘されているにもかかわらず機械翻訳の維持を主張したWikipedia:削除依頼/王の机を考慮したものですが、この議論を読むと「MDWikiで全言語版を統一してやるぜ」っぽい傾向が見えているので、そもそもWikipediaに向いてないんじゃないかなぁと考えますね。この方向性だとDoc Jamesさんが全権を持つ編集権限がクローズドなWikiでなければ無理でしょう。--Open-box(会話) 2023年1月12日 (木) 02:14 (UTC)
誤訳が見られない機械翻訳について
[編集]Pleuromeiaを検証したのですが疑問があったのでここで質問させていただきます。機械翻訳(この場合はGoogle翻訳)を使ったのが明らかでも、翻訳部分が短く大きな誤訳が見られない場合は、削除依頼に回さなくてもよいのでしょうか?ケースG-3の存続例には「利用可能ないずれかの機械翻訳の出力結果と完全に一致する文が記事に多数残されているものの、翻訳元原文の表現そのものが様々に解釈される余地が乏しいとされる場合において、翻訳文が日本語として正しく、明らかな誤訳がない場合」とありますが、これは「機械翻訳が使われていても、日本語として不自然ではなく誤訳がほぼない(意味は一応通る)場合は、存続でよい」という解釈でよろしいでしょうか。--YellowSmileyFace(会話) 2022年12月31日 (土) 13:52 (UTC)
- 何と言うか、初投稿が翻訳、しかもそれが削除されるとすぐに「利用者‐会話:柏尾菓子#「ITV_チャンネル・テレビジョン」について」を投稿する、植物の学名も分からないのに植物の記事を翻訳するなど、多分どこぞの荒らしの仕業なのでこれが削除の方針がどうたらといろいろ考える方が無駄な気もします。
- 削除の方針に従って対処をするならば、これはG-3ではなくG-2だろうと思いますが、どうともしがたいです。これこそドラフトに飛ばすべき案件です。この訳は英語版の導入部分をそのまま忠実に訳しています。しかし実際には、これは明らかに言葉を補うか説明を英語版本文から引き抜いて文章を再構築すべきもので、翻訳としては不完全です。例えば「日和見的な先駆植物」は矛盾している気がしますし、どう見てもパッと見て意味わからないでしょう。ここまで専門的な記事になると専門用語をぽんぽん出しても問題ないのかもしれませんが。同一投稿者のErythrosuchidaeも同じく、まず本文以前にしっかりとした辞典を引いて記事名を確定させなければなりません。多分探しても記事名の日本語訳がネットに落ちていなかったんでしょうね。
- 訪問者は限りなく少ないでしょうし、体裁だけ整えて放置がベストかもしれません。--Sethemhat(会話) 2023年1月1日 (日) 14:35 (UTC)
- ご返信ありがとうございます。ここまで短いと修正するのも時間がかからないので、時間が有るときに修正してしまおうと思います。--YellowSmileyFace(会話) 2023年1月4日 (水) 00:21 (UTC)
- コメント 生物から化学、物理、宇宙科学、経営、歴史に美術と、何でも1人で「翻訳文が日本語として正しく、明らかな誤訳がない」かどうかを確認できる人はいません。その都度、個々の主題についての知識を持ち合わせた人の協力がなければ難しいのですが、日本語版ではそれが「不可能」な状態に陥っているように思います。これは誰か特定の人物の責任ではありません。機械翻訳で大量の「適当な訳文」を生み出せる状況になった今、ボランティアに頼るしかないウィキペディアでは(他の言語がどうなのかは分かりませんが)、日本語版ではまったく対応が追いつかない、限界を超えた状況です。残念ながら、「翻訳文が日本語として正しく、明らかな誤訳がない」かどうかを検証できないのであれば、放置せざるをえません。
- ところで、具体的にPleuromeiaの記事がどうなのかを一応検証しておきましょう。全体がGoogle翻訳なのは、見てのとおりです。
- 「Pleuromeiaは、絶滅したlycophytesの属である」
- この文だけは、Google翻訳と異なるようです(Google翻訳はどんどん更新されますので、記事の投稿時点で実際にどうであったかは分かりません)。この訳は「翻訳品質」という意味ではマイナス点がつきます。なぜならば、何が「絶滅した」のかが「あいまい」だからです。たとえば、「行方不明になった作曲家の楽譜」「年老いた夫婦の犬」と同じあいまいさです。
- 「現代のミズニラに関連している」
- 英語の relate でほとんどの辞書の一番に出てくるのは「関連(する/させる)」です。しかし、生物学の文脈では、どうでしょうか。少し調べれば別の説明の仕方にたどり着くでしょう。
- 以上の2点で、この記事は「翻訳の質」が疑わしいと考えて取り組まなければならないきっかけとしては十分です。後はすべて機械翻訳ですから、何も分からずに文体の処理だけをしている可能性を考えないといけません。
- 「単一特異性」(monospecific)
- 分野によってはこれでいいのかもしれませんが、この文脈ではどうでしょうか。英語が1単語だからといって、日本語でも1つの訳語・熟語があるとは限りません。そういう場合は、書き下して訳します。
- 調べれば「プレウロメイア」に関する日本語の説明は見つかりますので、そういったものを読めば、英語に引きずられることなく日本語で説明する文を書けると思います。言い換えれば、この短いリード文だけの記事にするのであれば、原文はまったく忘れて、日本語の記述が書けます。--eWikiLearner(会話) 2023年1月7日 (土) 18:18 (UTC)
- 返信 (@EWikiLearnerさん宛) コメントありがとうございます。実は今ちょうど改稿を試みている途中でした。eWikiLearnerさんのご意見も参考にさせていただきます(日本語の文献を見つけるのに少々手間取ってはいますが)。--YellowSmileyFace(会話) 2023年1月7日 (土) 18:44 (UTC)
- 国会図書館デジタルコレクションやGoogleブックスで「プレウロメイア」、「ペルム紀」、「三畳紀」のキーワードで探してみてください。--eWikiLearner(会話) 2023年1月7日 (土) 18:53 (UTC)
- 報告 改稿してみました。残念ながら国会図書館デジタルコレクション・Googleブックスはこちらの諸事情で使えませんでした。--YellowSmileyFace(会話) 2023年1月7日 (土) 19:25 (UTC)
曖昧さ回避ページを他言語版から持ち込み
[編集]こういうケースも、翻訳だから版の継承は必要でしょうか?
また版の継承と別問題あるいは権利侵害などの弊とは異なるのですが、曖昧さ回避ページに、まだない記事名にリンクをつけて並べる作業は正しいのだろうか、ご意見を賜りたいです。赤リンクを減らそうと仮リンクで処理しようにも、英語版でも赤リンク、また元ページは英語版にしかない。想像するに、東欧諸語版なら記事があるのだろうか。
当該のページは悩ましいことに、編集要約欄に「英語版を元に作成」したと書いてはおられるのですが、版は切れています。2009年時点はまだ版継承は緩かったのかしら。
- 問題点
- 英語原文で一群のページ名が赤リンクだらけ。移植した2009-07-19時点の日本語版の初版も赤リンクが目立つ。
- 仮の対策
- 現状、初稿からほぼ進捗なしのため、窮余の策で英語版の東欧の1989年前後の円卓会議のカテゴリをSeealsoで案内。関係の人名ほかを補ってみたものの、仮リンクにせず直リンクにen iconを添えました。
- 処理の選択肢
むしろ、赤リンクからリンク記号を外せば十分ですか?
--Omotecho(会話) 2023年3月2日 (木) 07:59 (UTC)
- 本件には履歴継承が必要かどうか。結論から言うと「削除依頼を出すほどでもない」と思います。理由。1.初版作成者は「翻訳」とは言っておらず「作成」と言っている。2.翻訳元あるいは参照元の表現に創作性がないと思われる。未作成記事を並べる行為の是非。自分自身で同じジャンルの記事を1つや2つ、作成か翻訳などしていれば、まったく問題ない行為と思います。問題なのは、翻訳元記事に問題があるのにそれの日本語翻訳を期待して赤リンクを作りまくる行為でしょう。自分自身で同じジャンルの記事を1つや2つ、作成か翻訳などしてさえいれば、そのような翻訳元記事のおかしさに気づくので、そういった軽率な行為をしないですみます。ところで、本プロジェクトは「低質な翻訳」にスポットを当てて改善を効率化しようというプロジェクトのようです。翻訳元が固有名詞のリストでは品質の高低や改善の余地の広狭の議論の余地があまりないので、こういった話題の投稿は、その記事のノートとか、井戸端とかのほうが適していたかもしれません。--ねをなふみそね(会話) 2023年3月3日 (金) 06:29 (UTC)
- コメント 低質な翻訳を生む原因は何か。その視点は、複数を想定すると良いと考えて提言しました。
- 言語感覚のズレが大きい、とにかく何か書いて自分の履歴を増やしたい。そのような参加方法に目くじらを立てないとしても、ここで指摘したのは、元記事がない赤リンクなのに、あたかも他言語から持ってくるように装う詭弁を封じたかったからです。仮リンクに組めないのに、つまりウィキデータに還元できない時点のに、翻訳記事を立項しろという姿勢はアウトだと考えます。
- 他言語から持ってくるように装った赤リンク作成の是非。これをきちんと指摘したガイドラインをご存知でしたらご教示願います。--Omotecho(会話) 2023年10月21日 (土) 11:08 (UTC)
- @Omotechoさん: すみませんが、「他言語から持ってくるように装った赤リンク作成」の意味が分かりかねます。英語版ですら赤リンクが多い曖昧さ回避ページをわざわざ日本語版にも持ってくるな、ということであれば、WP:NOTDABなどに追記することになるかと思いますが、私の解釈が間違っているかもしれないので、お手数ですがもう少し説明いただければ幸いです。
- (以下については、私の論点の解釈に基づくコメントのため蛇足なものかもしれません。その場合は無視していただいて結構です。)今回の場合はノート:円卓会議 (ポーランド)で議論が行われた上での作成であることと、「円卓会議」という言葉が直接にはポーランドの事例のみを指す言葉ではないこと(例えば英語版からen:Hungarian Round Table Talksなどが翻訳された場合、ポーランドの事例の記事中に加筆するのではなく円卓会議 (ハンガリー)のような記事名になることが予想されます)から、不適切な曖昧さ回避の作成ではないと考えます。
- 履歴不継承については、一応版の特定は別に絶対必須というわけではないのですが、この場合はそもそも参考した英語版の記事へのリンクが無いため通常であれば版指定削除すべきものです。しかし、円卓会議の事例を一覧にしただけのものに創作性が認められるでしょうか。編集著作物として認めるほどのものかは分かりませんが、この程度で削除を依頼するのも過剰な気がします。--YellowSmileyFace(会話) 2023年10月21日 (土) 11:56 (UTC)
- 返信とノート:円卓会議 (ポーランド)のご指摘をありがとうございます。また「赤リンクがあるように装って他言語版から赤リンクを持ち込む」とは、例に引いたページとは無関係な想像であり、乱暴な表現でした。お詫びします。
- さて、まず履歴の不継承かどうかはご意見に賛成で、不問で良いと判断します。放っておいても大勢に影響はないですね。そこで、今回の赤リンク5件の事例を使い、処理を考えました。立項からだいぶ時間が経ち、そのおかげか、幸い他言語版に記事があるなどわかりました。
- おっしゃるとおり問題の本質は版の継承の件が一方にあり、他方、いつ時点に赤リンク集を持ってきて誰がいつ更新するか。2層の問題の後者が苦しいです。赤リンクのまとめページはこれだけではないはずで、漠然と腹が立ってきて乱暴な物言いをしてしまいました。赤リンクを立てるときは、スタブ以上の記事をいつか書いてもらえると期待するのは当然として、実現可能かどうかの線引きができないものかと感じます。(いや、線引きは無駄かもしれません。)
- ここで例にしたページは赤リンクを仮リンクで更新できます(下記の箇条書き1番)。上記で「ボット対応ができないか」と記したことに繋がるのですが、手作業で実験してみましたが、正直、しんどかったです。手間を減らす方法はウィキデータにクエリをかけるなどの技術力、あるいは人間が目視で確認するなら、専門分野の知識がある人にスラスラ判断してもらう。それが解決策でハッピーエンドだと有難いです。
- 疑問点
- 抗弁するようで失礼ながら、円卓会議 (ポーランド) のノートページでは、他の国の円卓会議をおしなべて記事にしてほしいとは読み取れませんでした。
- xxxx年の赤リンクは、yyyy年になると仮リンクに置き換えが可能? 記事が他言語版に立ったとして、確認の作業は誰がいつどのようにするのか?
- (1)について。
- これは後知恵です。親項目「ソビエト連邦崩壊」の見出しにできないのか。以下の(2)の各点を考えてみて、他言語版から赤リンクを持ってきても遅くない。
- (2)について。3件は、時機を見て仮リンクに編集したいです。
- (2-a)こちらは現時点の話であり、例のページの立項時点にさかのぼる話ではないです。ウィキデータで調べるとわかるが、赤リンクの立項者は調べるだろうか。
- では、誰が調べるのか? 他者に丸投げで良いのか? 私自身、月産で何件、処理するのか?
- (2-b)これは私論です。立項のめどがあるかどうか、検討してから赤リンクを立ててほしい。何を基準に判断すれば良いのか? ウィキデータも調べた、参考図書も当たってみた。
- 今回の実例
- (2-a)こちらは現時点の話であり、例のページの立項時点にさかのぼる話ではないです。ウィキデータで調べるとわかるが、赤リンクの立項者は調べるだろうか。
- 2009年7月時点で、他言語版に2件、記事が既存だとご指摘があるようですね。「en:Polish Round Table Talks(ポーランドの円卓会議)」「en:Hungarian Round Table Talks(ハンガリー)」
- 2023年10月時点で5件中、3件(2-a)は仮リンクが組めます。残る2件(2-b)は「CiNii」データベースで資料がないか探しましたが見つからず、ネットで当たりをつけました。ひょっとしてウィキデータを精査すると、東欧諸語もしくはドイツ語版のウィキペディアに記事があるかもしれませんが
- 力及ばずです。
- (2-a)ポーランド円卓会議, February-April 1989、ウィキペディアのカテゴリ:ポーランド円卓会議の出席者(4 エントリ)、[※ 1]
- (2-a)ハンガリー円卓会議, March-September 1989、ウィキペディア(10 エントリ)。
- (2-b)旧チェコスロバキア:The Czechoslovak Round Table Talks, November-December 1989[※ 2]
- (2-a)旧東ドイツ円卓会議(d:Q5328420), December 1989-March 1990[※ 3]
- (2-b)ブルガリア:The Bulgarian Round Table Talks, January-May 1990[※ 4][※ 5]
- ----------
- 注記
- 注記
--Omotecho(会話) 2023年10月21日 (土) 15:55 (UTC)
- 申し訳ございません。ただいま、返信できるほどのまとまった時間が取れていません。いずれ返信いたしますので、しばしの間お待ちいただければ幸いです。--YellowSmileyFace(会話) 2023年10月26日 (木) 14:01 (UTC)
- 大変お待たせいたしました。赤リンクがある曖昧さ回避ページの更新は、他言語版にページが存在することに気付いて更新作業を行う意思がある方が適宜やればいいだけの話かと思います。疑問点に返信してみます。
- 記事の作成については単なる例でした。困惑させてしまったようで申し訳ありません。別に記事を作成してほしい、というわけではなく、「円卓会議」という言葉はポーランドの件だけを指す言葉ではないのに、「円卓会議」の記事がポーランドの件に関する説明になっているのはおかしいから、ポーランドの記事は「円卓会議 (ポーランド)」に移動して跡地に曖昧さ回避ページを作成しよう、というように私は解釈しています。「円卓会議 (ポーランド)」のソビエト連邦の崩壊への関連性については、私にはわかりかねますが、どちらかと言えば東欧革命の子記事とする方が適切ではないかと思います。そもそも「ソビエト連邦の崩壊」は「親項目」とされているようには見えませんが。
- 先述の通り、更新作業ができる方が適宜行えばよいと考えております。
- Omotechoさんの私論には同意しますが、現時点で基準を制定するのは難しいものと考えます。ケースバイケースで、削除依頼を提出するか更新作業を行うかを判断することとなるでしょう。誰が調べるのかという問いに関しては、やはりできる方が行う以外の解決策はあまりない気がします。--YellowSmileyFace(会話) 2023年11月3日 (金) 00:28 (UTC)
- ありがとうございます。おかげさまでポイントが絞れました。これにて終了にします。(叶うことなら「執筆依頼」などに赤リンクとしてまとまると、見やすいだろうけれど、それは人海戦術でも無理なので、いつか自動化技術が見つかると祈ります。)--Omotecho(会話) 2023年11月3日 (金) 01:54 (UTC)
膨大な量の雑翻訳記事への対処方法について
[編集]表題の通りです。プロジェクト:翻訳検証/利用者別にあるArumaddilo, Keita.Hondaおよびその監視逃れ利用者:Tabitan(会話 / 投稿記録)、BletillaおよびKeisukeng(まだマシ組)。これらの利用者の方々(前のグループは特に)は翻訳記事を濫造されていますが、量が多すぎてとても削除依頼など出せません。これこそDraftの出番かもしれないのですが、方針を固めるのはとても大変すぎます。これらの利用者の編集は誰かは絶対に見ているはずなので、見てもあまり対処しないJawp全体の連帯責任的なところもある程度あるのかと思いますが、ともかく何か対処はしなければならないかなと思っています。 そこで、削除までできないのならば注意喚起ということで、訪問読者の方々に記事本文を見ずにブラウザバックして頂けるよう、テンプレートを仮作成してみました(文章は要修正)。
プロジェクト:翻訳検証による検証の結果、この翻訳記事は記事として十分な質を持っていないと判断されました。多くの誤訳がありますので、このページを情報源とはしないでください。
現在、削除依頼の提出待ちです。 現行記事の日本語を表面的に修正した改稿は基本的にいまだWP:DP#Gに該当すると判断されることが多いです。改稿を希望される方はプロジェクト‐ノート:翻訳検証へご一報ください。 |
この問題全般およびこのテンプレートは有効な解決策となることができるかということに対し、コメントを皆様に頂ければ幸甚です。--Sethemhat(会話) 2023年3月27日 (月) 15:25 (UTC)
- Sethemhatさん、いつもいつもお疲れ様です。勝手ながら、利用者:YellowSmileyFace/作業場でテンプレートに改変を加えてみました(差分)。
- これは{{翻訳検証}}にも言えることなのですが、テンプレートが大きくて画面が圧迫される印象を受けましたので、<big>を取り除き、代わりに下方の文章に<small>を加えてみました。サイズ的には{{出典の明記}}と同じくらいのサイズを目指しました。
- 太字の箇所を変えてみました。また、「このページを情報源にしないでください」を「このページを情報源とする際には注意してください」に変えました。ところで、@Sethemhatさんは改稿された記事にもこのテンプレートを貼るおつもりなのでしょうか。それなら「多くの誤訳がある」の断定調の表現を変えたほうがよろしいかと思います。
- 「現行記事」以下の文章の位置を調整してみました。改稿についての文章だったので、改稿はお知らせくださいの文の後の方が自然だと考えました。また、初心者に優しいようにショートカット表記を無くしました。
- 以上です。この改変について、Sethemhatさんのご意見をいただければ幸いです。将来的に、改稿されていない記事は削除されるのが望ましいでしょうが、一時的な対処としてはテンプレートを貼るのがベストなのかもしれません。一時的のつもりが長期的になってしまいそうですが...--YellowSmileyFace(会話) 2023年3月27日 (月) 22:41 (UTC)
- Template:要改訳やTemplate:Rough translationとの差別化はどのような点にある/どのような点に置きたいのでしょうか?見た限りではプロジェクト名が前面に出ていることと削除を示唆する以外に差異がないように見えます。このテンプレートを貼るということは検証結果がもうあるということで、それなら逐次的にどんどん削除依頼にかければいいし、そうでない場合も結果をノートに移したうえで要改訳を貼れば注意喚起と執筆者への指摘には足るのではないかなと思いました。--Merliborn (会話) 2023年3月28日 (火) 03:31 (UTC)
- {{翻訳検証}}は{{Sakujo}}とほぼ同じ扱いを目指しているのであの大きさですが、もし大きいのが好ましくないor他の警告系テンプレートに合わせるというのであれば小さめのサイズでも構いません。
- 「情報源にしないでください」は絶対禁止の意思を込めてこの文章にしています。注意よりも強い文章が好ましいかと私は考えています。
- 「改稿された」とは「すでに他の利用者の手が入っている」ということでしょうか。これは難しいところですね。Wikipedia:削除依頼/IP:2400:4050:9920:BA00:0:0:0:0/64の作成記事(追加分)で判明した点として、通りすがりの方は表面的に修正をするもののそれは十分な修正ではなく、また削除依頼を出したりとか、その利用者が他にも投稿している記事はないかとかまで考えないということが挙げられます。しかし修正したということは事実ではあります。このテンプレートは大体特定利用者が出した記事にまとめて貼っていくことを想定していますので改稿した利用者の方にも検証背景を知って頂く必要があるかと思い、さらに「機械翻訳に由来する」の文言追加を含む修正を加えました。以下は現在の全引数を使用した例です。
プロジェクト:翻訳検証による検証の結果、この翻訳記事は翻訳において多数の問題があると判断されました。機械翻訳に由来する多くの誤訳が含まれている可能性がありますので、このページを情報源とはしないで下さい。検証の詳細な過程についてはhogeを参照してください。 現在、プロジェクト参加者による改稿待ちです。現行記事の日本語を表面的に修正した改稿は基本的にいまだWikipedia:削除の方針のケースGに該当すると判断されることが多いことにご留意ください。改稿を希望される方はプロジェクト‐ノート:翻訳検証へご一報ください。 本項目を過去に編集された方へ
本記事は他にも翻訳に問題のある記事を作成している利用者:Arumaddilo(会話 / 投稿記録)の投稿記事の一部です。機械翻訳をベースとした記事は翻訳元の原文を確認しない限り常に誤訳の可能性が存在しており、日本語のみの軽微な修正は根本的な修正にならないことが多いです。このため、善意の編集であっても巻き込まれて記事ごと削除されてしまうことがあります。ご理解下さい。 |
- 返信 (Merlibornさん宛) これらのテンプレートは1、正確性に問題があるという旨の注意の文言が弱い。2、見た人に改稿へ協力してほしいと申し出ている。この2点が本テンプレートと違っているところです。今回提案しているテンプレートは記事に明確に問題があると読者および編集者にも周知し、改稿させないことが目的です。なぜならば、テンプレートにもある通り中途半端な修正ではケースGを脱し切れないことが多いからです。なお、第2第3引数もあります。
--Sethemhat(会話) 2023年3月28日 (火) 14:00 (UTC)
-
- テンプレートの大きさについて、自分としては{{出典の明記}}くらいのサイズを想定していました。削除依頼が提出されている状態ではないのですし、そこまでアピールしなくても良いかと思います。
- 「絶対禁止」ということですが、適切に改訳されている記事すらもそうしてしまうのは勿体ないと感じますので、自分は「注意してください」くらいが良いかと思いました。ですが、強い意志がお有りのようですので、強く反対するということはいたしません。--YellowSmileyFace(会話) 2023年3月29日 (水) 12:41 (UTC)
- 確認なのですが、このテンプレートの想定使用状況は (1)翻訳についての検証が行われ、(2)翻訳における問題が多数あることが確認されたが、(3)削除依頼を同時に多数行うためのリソースの不足のため、削除依頼を出せる状態にない。というような状況と考えてよいのでしょうか?そうでないとここまで断定的な文章はWP:BATTLEやWP:REQUIREDに抵触するように思います。
- 誤訳記事というのは立項者以外にも編集者がいるものですし、年月が経って後から酷い誤訳交じりの記述が足されたりすることもあるので、投稿者名を掲示して記事本文中に晒す・特定個人にのみ責任をかぶせるような記述にする・そのような記述をわざわざ用意することに意義があるとあまり思えません。(記事本文中に編集者への断り書きが混在することは、WP:SELFなどもありあまり歓迎されなかったはずです。)問題のある参加者の投稿についての注意喚起は、別口でノートページに書くべきものと思います。
- --Merliborn (会話) 2023年3月29日 (水) 15:17 (UTC)
- ご指摘の二点両方とも理があると思います。一番目について、このテンプレートについて運用想定が甘かったと感じましたので案をもう少し練りたく思い、再考させて頂きます。
- 二番目については、個人について責任をかぶせるのを避けるからこそ特定の利用者に雑記事を量産させることを許しているのだと私は考えています。しかし、たしかに仰る通り利用者名を明確に出すのは確かにためらわれる点だと思いますので削除します。しかし、「書きこんだことが削除により無駄になる可能性がある」ことは知らせなければならない事実だと思いますので、残置するつもりです。WP:SELFの内容が納得できるものだとは正直なところあまり思えないところです。--Sethemhat(会話) 2023年4月2日 (日) 12:08 (UTC)
(メモ)119.228.0.0/16について
[編集]投稿記録; 翻訳をちょいちょい行っているが中途半端に抄訳してしまっているせいで微妙に不完全な翻訳になっている感触。例えば、ジョゼフ・バースティン社対ウィルソン事件において「『奇跡の判決』とも言われる」と書いているが、英語版を見ると争点となっている映画の名前そのものがThe Miracleであって洒落のような命名であるから、カタカナにするなどの対策が必要だと思われる。スタブは多めなものの翻訳は正確に見えるため、次投稿した時にアカウント作成のお願いをすれば十分と思います。--Sethemhat(会話) 2023年4月7日 (金) 08:24 (UTC)
「言語と国際化ニュースレター」の創刊(情報)
[編集]情報 財団言語技術チームが旬刊の「言語と国際化ニュースレター」をメディアウィキで創刊しました。
- 初号はコンテンツ翻訳拡張機能(MinT導入)による普及度の伸びほかを述べています(ウィキペディアの202言語版)。
- 購読も可能です。
--Omotecho(会話) 2023年10月21日 (土) 10:31 (UTC)
- その情報は、日本語ではありませんが、お知らせされています。「Wikimedia Language team」は WMFの言語チームというより、メディアウィキ技術の言語チームなのでしょうか。
- MinT は meta-wiki でコメント依頼[1]にかかっていて、そこにはOmotechoさんも参加されていらっしゃいます。うがった見方で申し訳ないのですが、プロジェクト:翻訳検証に情報を記したのは、meta のコメント依頼への参加の招待(強く言えば要請)に見えるかもしれません。--温厚知新(会話) 2023年10月21日 (土) 13:41 (UTC)link失敗に付き、補記--温厚知新(会話) 2023年10月21日 (土) 14:10 (UTC)
- @温厚知新さん、お知らせページのご案内まで知りませんでした。ありがとうございます。私の発想はこの「お知らせを出す」という予告が翻訳者メーリングリストで来たため、いずれ告知は英語だろうから、せめてリンク元は日本語で読みたいと考えて訳しました。別件、コメント依頼のページで職員からついぞ「当年予算年度の財団事業項目に上がっている」との指摘はありませんでしたし、ニュースレターで初めて帰結を知りました。
- MinTに関するコメント依頼(メタウィキ)
- コメント依頼をご覧いただいたのですね。誘導の意図はありませんが、そういう目で見られる可能性のご指摘は肝に刻みます。
- はっきり申し上げます。私は何が何でも機械翻訳・翻訳拡張機能を使えなくする案に一度も賛同していません。条件付きで解放してほしいと望みます。MinTの件ではニュースレターを読んで、ある意味、「しまった、そうならそうと早く言ってくれ」と感じました。
- お恥ずかしい話、ニュースレター創刊号を読み、自分の不明にびっくりしています。チェロキー語など機械翻訳にかからないものと決めつけていたので、「MinTだったら救われる」可能性、翻訳記事で記事の量や質を拡充できる点に気づきました。何語版か忘れましたが、過去の議論ではコンテンツ翻訳拡張機能で記事の数を充実したところがあると示され、絶滅危惧言語で記したものを残す可能性はあるかもしれないが不明と感じます。
- ひるがえって、日本語版は複数の機械翻訳ソフトを選べる言語対の一つであるからこそ、MinTに違和感を抱くのかもしれません。現にご指摘のコメント依頼では、他の言語に訳す人から「私はいっさいMinTのオススメは参照しない」と断言される人もあります。
- お言葉を返すようですが、言語チームは「メディアウィキ技術の言語チーム」なのですか? 技術系の情報サイトがメディアウィキであり、メディアウィキという場が主体ではないと理解しますが、従前の記事ページのどの箇所に間違いがあるか、ご指摘願えるなら望外の幸いです。--Omotecho(会話) 2023年10月21日 (土) 17:55 (UTC)
- ご返信ありがとうございます。
- 確かに私では機械翻訳で読むことしかできないため、詳しい情報は受け取れておらず、かなりの誤解をしていると認識します。日本語への翻訳作業に大変感謝します。私も
何が何でも機械翻訳・翻訳拡張機能を使えなくする案
には賛同いたしかねます。十分な言語能力を持つ方に、有効に使ってほしいと思っています。翻訳力のない私なので、コンテンツ翻訳もMinTも使ってみようとは思ってはいないですが、昨年「Wikipedia:お知らせ/過去ログ/2022年11月#コンテンツ翻訳の機械翻訳機能廃止のお知らせ」の時から変わって、MinTが加わったので、機械翻訳廃止の撤回に進んでしまわないかを心配しています。廃止前のツールより良いものであるならば、歓迎すべきものなのかもしれませんが、現状はむしろ以前のものがまだましであったような印象に見えてしまって、さらに後退してしまうのでは…と思ってしまいます。 - 言語チームについては私も解りません。財団は人種問わず母語問わずにたくさんいて、高い言語能力で各地のウィキマニアなど各種交渉ごとをしていたり、現地からの希望要望を財団に伝達したりするイメージっだったのですが、『財団言語技術チーム』となっていたから、mediawikiの言語対策を行う技術者なのかと思った次第です。私もよくわかっていなくて、申し訳ありません。--温厚知新(会話) 2023年10月21日 (土) 19:06 (UTC)
- @温厚知新さん、お知らせページのご案内まで知りませんでした。ありがとうございます。私の発想はこの「お知らせを出す」という予告が翻訳者メーリングリストで来たため、いずれ告知は英語だろうから、せめてリンク元は日本語で読みたいと考えて訳しました。別件、コメント依頼のページで職員からついぞ「当年予算年度の財団事業項目に上がっている」との指摘はありませんでしたし、ニュースレターで初めて帰結を知りました。
第一に、Translate拡張機能とコンテンツ翻訳は別物です。Translate拡張機能で、日本語への翻訳でもMinTが導入されておりますが、ウィキペディアのコンテンツの翻訳使うものではないため、本プロジェクトとは直接的には関係がありません。第二に、コンテンツ翻訳での機械翻訳の受容はウィキペディアの言語版によって異なると思いますが、日本語版ウィキペディアのコンテンツ翻訳で機械翻訳を復活させるという話は寡聞にして知りません。最後に、蛇足ですがMinTの品質について私見を述べますと、日本語への翻訳の品質はGoogle翻訳よりもかなり悪いです。随分昔に使われていたYandex翻訳と比較しても良いとは言えません。--Kokage si(会話) 2023年10月22日 (日) 04:03 (UTC)
- @Kokage siさん、精査をありがとうございます。話が前のめりになった点、メタウィキの議論を百科事典空間に演繹したのではないとお断りし、そのように読めたなら不明の至りですし猛省します。
- 抗弁としではなく、ひとつだけご指摘申します。ニュースレターにあるとおり、財団はウィキプロジェクトのなるべく多くの言語版にMinTを導入したい。翻訳データベースの充実で不具合は乗り越えられるという視点で論じます。百科事典も対象であり、早道は実績のあるコンテンツ翻訳拡張機能です。現状、利用者人口の多い順に、ウィキペディアの英語版と日本語版がその導入を拒否しています。
- では上記の方針を今季、明確に打ち出したので、状況は変わるまいと予測して安全でしょうか。未来永劫、日本語ウィキペディアはCX2不採用特区であるのか? そうあって然るべしとの保証はないと焦るのは過敏でしょうか?
- 一事が万事ではありませんが、先例に学ぶべき点はあるかと感じます。
- ベクター外装の表示更新が突然、降って湧いたように実行された件をご記憶ではありませんか? あるはずのボタンが消えたり、文字表示領域が変わったりと目立つ変化でした。その前段として意見の聞き取りがあり、「やめてね」と伝わったと安心していたら、予測と真逆反対の事象だったと記憶します。
- それでも変更をやめてもらい、結果オーライです。皆さんびっくりされたのでは? これは単発の事故として忘れずにおこうと思いました。
- あれは両面ありまして、意思疎通のボタンの掛け違いは解消できる前例にもなりました。
- 日本語版ウィキペディアで翻訳の仕組みにもっとも明るいこのプロジェクトを信頼しております。また財団技術者から見たら、日本語版ウィキペディアで機械翻訳に明るい集団はここしかない点は自負なさっていると拝察しており、情報提供するだけのつもりが脱線しました。
- お知らせしたニュースレターが広くウィキメディア全般の言語、翻訳対応の情報源としてお役に立つなら望外の喜びです。--Omotecho(会話) 2023年10月23日 (月) 12:33 (UTC)
- 基本的に人が集まるのがウィキペディアに偏っているから、必然的にウィキペディアが議論の場所になっていることが多いですが、日本語版ウィキペディア単独で解決できる問題ではないから話がややこしくなっているということだと思います。将来的に機械翻訳がどうなるかはわかりませんが、MediaWiki側の問題なんかは日本語の議論の場所もそっちに作って、日本語版ウィキペディアにも影響がある議論をMediaWikiでやってますとお知らせする形にする方が開発者にも届きやすくて理想的なんじゃないかなと思います。--Kokage si(会話) 2023年10月24日 (火) 12:33 (UTC)