「Wikipedia‐ノート:削除の方針」の版間の差分
→ケースGの改訂提案(機械翻訳): 削除プロセスでなく、編集による白紙化では? また、問題点の周知が重要 |
→ケースGの改訂提案(機械翻訳): 賛成寄りコメント タグ: 2017年版ソースエディター |
||
114行目: | 114行目: | ||
:この、翻訳作業に問題があるケースを削除する方針は、[[Wikipedia‐ノート:削除の方針/2019年#ケース Gの改訂提案-201901|2019年頃の提案]]に基づいたものなのですね。私はアクセス頻度が低いので、把握していませんでした。今回のMcYataさんの提案に触れるまであまり意識してきませんでしたが、たしかに機械翻訳された記事は酷いですね。これをウィキペディアの正規の解説記事ページとして公開することはとても認められないと思います。そのための対処方法として削除の方針に基づき削除できることを明確化しようというのは理解できます。ただ、これはそもそも2019年頃に導入された現行の扱いについてもいえるのですが、機械翻訳などの翻訳品質の低さによって結果的に記事の品質が低くなっているというものについては、「削除」ではなくて「白紙化」等による対応でも十分ではないかと思います。上で例に挙げられているような「誰が見てもすぐおかしいことがわかる機械翻訳の成果物のようなもの」については、見つけた人が「翻訳品質が低すぎて日本語の記事として成立していないため白紙化」とでも書いて白紙化してもおとがめなしでしょう。とがめだてして差し戻そうとする人にこそ、翻訳し直したり新たに書き起こしたりする必要が出てくるわけで、品質の低い翻訳もどきの記事が公開されるという状態は回避できます。削除依頼などの手間暇をかけて削除に持ち込む必要性は薄いでしょう。これがもしも、「白紙化された青リンク記事であるよりも記事の不存在を示す赤リンクのほうが新規立項を促す効果があって望ましい」というような理由でもあるのであれば、「削除」する必要もあるかもしれませんが、私はその必要はあまり感じません。運用面から見ても、削除の方針によって削除プロセスにのせる基準として、日本語記事としての品質の低さという誰が見てもわかる外形的な判断基準でなく、機械翻訳を利用したかどうかという原理的には「中の人」しか知ることのできない事柄を判断基準に据えるというのも筋が良くなさそうに思います。 |
:この、翻訳作業に問題があるケースを削除する方針は、[[Wikipedia‐ノート:削除の方針/2019年#ケース Gの改訂提案-201901|2019年頃の提案]]に基づいたものなのですね。私はアクセス頻度が低いので、把握していませんでした。今回のMcYataさんの提案に触れるまであまり意識してきませんでしたが、たしかに機械翻訳された記事は酷いですね。これをウィキペディアの正規の解説記事ページとして公開することはとても認められないと思います。そのための対処方法として削除の方針に基づき削除できることを明確化しようというのは理解できます。ただ、これはそもそも2019年頃に導入された現行の扱いについてもいえるのですが、機械翻訳などの翻訳品質の低さによって結果的に記事の品質が低くなっているというものについては、「削除」ではなくて「白紙化」等による対応でも十分ではないかと思います。上で例に挙げられているような「誰が見てもすぐおかしいことがわかる機械翻訳の成果物のようなもの」については、見つけた人が「翻訳品質が低すぎて日本語の記事として成立していないため白紙化」とでも書いて白紙化してもおとがめなしでしょう。とがめだてして差し戻そうとする人にこそ、翻訳し直したり新たに書き起こしたりする必要が出てくるわけで、品質の低い翻訳もどきの記事が公開されるという状態は回避できます。削除依頼などの手間暇をかけて削除に持ち込む必要性は薄いでしょう。これがもしも、「白紙化された青リンク記事であるよりも記事の不存在を示す赤リンクのほうが新規立項を促す効果があって望ましい」というような理由でもあるのであれば、「削除」する必要もあるかもしれませんが、私はその必要はあまり感じません。運用面から見ても、削除の方針によって削除プロセスにのせる基準として、日本語記事としての品質の低さという誰が見てもわかる外形的な判断基準でなく、機械翻訳を利用したかどうかという原理的には「中の人」しか知ることのできない事柄を判断基準に据えるというのも筋が良くなさそうに思います。 |
||
:あと、まったく論点が変わりますが、この問題については、低品質の翻訳記事ができた後にどう対処するかということも大切ですが、上でMcYataさんが指摘してくれているような、機械翻訳による記事乱造がどれほどウィキペディアの品質を下げる結果になるのかということが、もっと広く理解されることによって機械翻訳による記事を作成する人がいなくなるのが理想的です。Tamago915さんが指摘された[[Wikipedia:翻訳のガイドライン]]のようなところも活用して広めていきましょう。この問題はウィキペディアにおける「常識」のようになってほしいものですね。(いや、私が疎かっただけですが・・・ごめんなさい)--[[利用者:へのいち|へのいち]]([[利用者‐会話:へのいち|会話]]) 2022年3月2日 (水) 04:25 (UTC) |
:あと、まったく論点が変わりますが、この問題については、低品質の翻訳記事ができた後にどう対処するかということも大切ですが、上でMcYataさんが指摘してくれているような、機械翻訳による記事乱造がどれほどウィキペディアの品質を下げる結果になるのかということが、もっと広く理解されることによって機械翻訳による記事を作成する人がいなくなるのが理想的です。Tamago915さんが指摘された[[Wikipedia:翻訳のガイドライン]]のようなところも活用して広めていきましょう。この問題はウィキペディアにおける「常識」のようになってほしいものですね。(いや、私が疎かっただけですが・・・ごめんなさい)--[[利用者:へのいち|へのいち]]([[利用者‐会話:へのいち|会話]]) 2022年3月2日 (水) 04:25 (UTC) |
||
* {{コメント}} 賛成寄りです。但し、その適用条件、すなわち「機械翻訳をベースとしている」は具体的に詰める必要があると思います。これについては、誤訳を軸に見ていくのがよいかとは思います。 |
|||
* 現状のケースG-2の問題点として、「日本語になっている部分が、日本語版での記述として意味のあるものになっていれば、存続としてください。」というところがあると思っています。最近の機械翻訳の性能向上は著しく、特に外形的にすぐにわかる文法的な正しさであったり、自然に読める意味の取れる翻訳文を生成する、というところはかなりよくなってきています。一方で、文脈を把握するような学習を重視するために、細かく見ていくと訳抜けが生じたりすることもありますし、また、ニュアンスを汲み取った適切な単語選択というのは機械翻訳の苦手とするところです。そして、最近機械翻訳の記事で問題とされているのは、日本語の文章としてみると何らかの意味が通ってしまう文章が記事全体にわたって続いているが、部分的に致命的な誤訳があるだとか、専門用語の選択に問題がある、といったことです。機械翻訳結果だけをベースに記事を立てるのは、明らかに品質の問題があると推定される一方で、なまじ機械翻訳の性能がある程度上がってきているために'''、一見すると「日本語としては意味が通ってしまう」ため、ケースG-2の適用が悩まし'''くなってしまっています。この問題を解消するために、「機械翻訳をベースとしていることを根拠として、百科事典の記事として相応しくない誤訳が含まれていることを推定して削除することができるようにする」、今回の提案は有用だと思います。(本当は改稿するのがベストで、最低でも、知見がある人が記事を確認して、ちゃんと致命的な誤訳を指摘するだとか専門的な単語選択に明らかに誤りがあることを明らかにして削除するべきなのでしょう。しかし、現状では[[利用者:McYata/コンテンツ翻訳レビュースペース]]を見ていただけるとわかります通り、コンテンツ翻訳された記事の最低限の品質チェックすら、新規立項に追いつきません。そうした「査読」のような対応を望むフェーズはもう過ぎていて、今は立項側の対応を求めるべき段階です。) --[[利用者:紅い目の女の子|紅い目の女の子]]([[利用者‐会話:紅い目の女の子|会話]]/[[特別:投稿記録/紅い目の女の子|履歴]]) 2022年3月2日 (水) 05:30 (UTC) |
2022年3月2日 (水) 05:30時点における版
このページは英語版ウィキペディアのWikipedia:Deletion policy から翻訳された内容を含みます。翻訳元ページの履歴にある執筆者一覧も参照してください。(この通知は8552の版に対応します。 ) |
このページは2006年4月13日に削除依頼が提出されました。 議論の結果、存続になりました。 |
過去ログ一覧 |
---|
このページでは SpBot による過去ログ化が行われています。解決済みの節に |
ここは、Wikipedia:削除の方針についての議論の場です。次のノートも参照してください。
- Wikipedia‐ノート:削除依頼 - Wikipedia:削除依頼の運用に関して
- Wikipedia‐ノート:著作権 - 著作権に関して
削除の方針の改定について合意が得られた場合には、必ずWikipedia:削除の方針本文を修正してください。
重複記事の削除について
さいきん、重複記事としてケースZで依頼を出しているのを見かけます。そこで、新たなケース「H」の追加を提案いたします。--2001:268:9B23:B81C:1518:E428:C04E:C9F6 2021年7月21日 (水) 10:13 (UTC)
- LTAとして投稿ブロック済み。--ネイ(会話) 2021年7月21日 (水) 13:26 (UTC)
芸能人の薬物犯罪に関するB-2除外について
WP:DP#B2に現在記載されている以下の文言について再考を提案します。
ただし、著名活動によって特筆性を持つ芸能人(声優を含む俳優、歌手、タレント)の逮捕に関して、その逮捕歴が大麻・麻薬等の違法薬物の使用あるいは所持に関する逮捕であり、かつ複数社の報道がある場合についてはその芸能人の逮捕に関する記述に関してはB-2から除外します。
上記はこちらの議論にもとづき2019年12月に追加されたものです(特別:差分/75514386)。この文言が追加されるに至った2019年の議論が言わんとしていることは私も理解できる部分もあるのですが、それでも逮捕&複数社の報道という条件で「B-2から除外」とまでしてしまうのは行き過ぎではないのかと思うのです。極端な事例を申しますと、ASKA氏の2016年の逮捕は、無罪であるばかりか証拠不十分で裁判にもなっていませんし、ASKA#薬物事件に書かれている著名活動への影響も、ほとんどは2016年の逮捕による影響ではなく、それ以前の逮捕による影響ではないでしょうか。ASKA氏については2016年に薬物犯罪の捜査を受けた旨をブログで自己発表[1]していますので、著名活動への影響など考えるまでもなくASKAのページから2016年の逮捕に関する記載をプライバシーを理由に削除などする必要はないでしょうが。これがもしも自己発表のない事例であったらどうなるのか、ということです。芸能人の薬物犯罪と言っても事情は案件ごとに様々でありましょうから、逮捕&複数社の報道という条件での「B-2から除外」というのは、私には少々過激すぎるように思えるのです。
捜査機関が芸能人を逮捕したとなれば報道が過熱しやすいのは薬物の嫌疑を理由としたものだけでなく他の理由での逮捕も同じであるように思いますので、そもそもこのように薬物についてのみ別途の記載を設ける必要があるのか私にはよくわからないのですが、どうしてもこの件について方針に記載を設けるということであるのならば、例えば以下のように少しB-2が適用される余地を残した方が良いのではありませんでしょうか。
著名活動によって特筆性を持つ芸能人(声優を含む俳優、歌手、タレント)の逮捕に関して、その逮捕歴が大麻・麻薬等の違法薬物の使用あるいは所持に関する逮捕であり、かつ複数社の報道がある場合についてはその芸能人の逮捕に関する記述に関しては、一般的にはプライバシー侵害が成立しないことが多いでしょう。ただし裁判の内容、報道の量・質・継続期間、著名活動への影響の大きさ、逮捕の事実を世間に公表する本人の意思の有無、嫌疑についての本人の主張など、個々の事例に即した判断が必要です。
--Henares(会話) 2021年11月27日 (土) 07:18 (UTC)
- 申し訳ありません。この議論を告知することを忘れておりましたので遅ればせながらコメント依頼と{{告知}}貼り付けを行いました。ついでに一点補足します。上記にて示しました文案は一例として提示させていただいたつもりです。要するに、「B-2から除外」と書かれているがために芸能人の薬物逮捕歴というだけでプライバシー侵害による削除依頼は一切できないという状況を回避できれば、上記の文案でも、芸能人の薬物逮捕歴に関する記述の除去でも、なんでも構わないと思っています。しかし、上記の文案作成に関わった方々の意図がどうであれ、現状では「芸能人の薬物犯罪の疑いによる逮捕歴をプライバシー侵害を理由に削除依頼することは一切認められない」と読み取ることが自然な言葉になってしまっていると思います。--Henares(会話) 2021年11月29日 (月) 13:00 (UTC)
- コメント方向性に同意します。指摘のある「ただし~。」の1文については、余計な例示になっていると考えます。除去してしまってもよいを思いますが、案として出ている文章への改訂でも賛成します。
- 逮捕されたことは事実としてあるでしょうが、その後の経過は影響を含めそれぞれですし、そもそもその前の文で、「元服役囚に、服役囚であった事実を公開されない権利を認める判例がある」とあり、薬物事件を特に取り出して除外する規定は、当該権利と相反すると考えます。報道のような一過性のものとWikipediaへの掲載を比較衡量すれば、Wikipediaへの掲載はむしろより厳しく制限すべきだろうと思います。
- 制定当時、芸能人における薬物事件での逮捕歴等の記載が活発に行われ、その対処に追われたという経過があり、制定に至ったという点については、やむを得ない部分があろうかと思いますが、先に述べたとおり、忘れ去られる権利として確立している以上、逆に除外規定を設けるほうがリスクを高めるだろうと思います。ただし、今回の合意ですべての薬物事件における記載が不可になるわけでも、可になるわけでもないことは言うまでもないのですが、ルールの文面しか見ない人がいますので、その辺りのフォローをどうするかは悩ましいですね。--Kodai99(会話) 2021年11月29日 (月) 14:39 (UTC)
- Kodai99さん、ご意見ありがとうございます。一般論として、こうした法律がらみの方針で「文面しか見ない人」へのフォローは、現実的に考えると困難だと思っています。もちろん文面だけで削除すべき場合orすべきでない場合がすべてわかるようにできれば理想なのですが。Wikipediaに絡む法律問題をすべて文面だけでわかるように方針を書こうとすると、何百頁もある法学書のような長大な文章にならざるを得ないと思うのです。そのような方針を書くマンパワーもなければ、書いたところで読んでくれる人はあまりいないでしょう。ですからこうした法律に絡む方針は基本的なことを書いておくのみで、あとは個々の事案に関連した出典、判例、条文、当局や専門家の解説といったものを、削除依頼に関わろうとする利用者がWikipediaの外部で調査してきてくださることを前提としたものにしかできないのではないかと思っています。
- このような一般論は芸能人の逮捕歴についても当てはまるのではないでしょうか。殺人、窃盗、過失運転等々、世の中には数限りなく逮捕理由がありますが、これらをすべて場合分けしてWP:DP#B2に書いておくというのはさすがに現実的ではないでしょう。薬物犯罪についてだけ見ても、使用の罪、所持の罪、売買の罪、ASKA氏のような不起訴の場合、起訴されたけど無罪の場合、有罪の場合、覚せい剤の場合、脱法ドラッグの場合・・・・そんなことを全部方針に書ききれるわけがないです。冒頭で示しました文案に「個々の事例に即した判断が必要」ということを書きましたのは、そうした一つとして同じものが存在しないであろう個別の事情を切り離して「芸能人の薬物犯罪が報道された場合」という画一的なルールを設けることが無謀だと思ったからです。しかしそうなると、「個々の事例に即した判断が必要」などということは芸能人の薬物犯罪でも政治家の性犯罪でも無名な人の殺人でも、あらゆる前科に共通する一般論でしかなくなってしまいます。芸能人の薬物犯罪に関する文章を盛り込む合意が過去に成立していたことに鑑みて「どうしてもこの件を書きたいという人がいらっしゃるならば」という意味で対案となる文面をひとつ示しましたが、個人的には消してしまったほうが手っ取り早いかもしれないとも思っています。--Henares(会話) 2021年12月1日 (水) 05:45 (UTC)
除去提案
発議から相当期間経過し私自身いろいろと検討しましたが、改めて当該記述を除去することを提案します。具体的には特別:差分/75514386で追加された文言の除去を想定しています。上記にて申し上げたものを含め除去理由を簡単に繰り返します。
- 「芸能人の薬物犯罪の疑いによる逮捕」に関してもプライバシー侵害が成立する場合は想定しうるため「除外」をしてしまうと法的問題がある記述の削除ができなくなってしまう恐れがあるため。
- 上記1.の問題を解決するためプライバシー侵害が成立するものと成立しないものを分けて詳細に説明をしようとすると長大な文章にならざるを得ず現実的ではないため。
- 発議から相当期間経過しても積極的に「芸能人の薬物犯罪の疑いによる逮捕」に関する説明をこの方針に残しておくことに意義があるとする利用者が現れなかったため。
上記のうち2.のような問題は例えばWikipedia:プライバシー侵害対応の方針(仮題)などのような、プライバシー侵害問題に特化した方針文書を作成すれば多少掘り下げて説明することは問題ないと思います(限度はあるでしょうが)。しかし削除に関する全般的議論を書くことを想定しているこの方針にあまりプライバシーに関する説明を長々と書くことは適切ではないように思いました(「芸能人の薬物犯罪の疑いによる逮捕」の件に限らず、個人的にB-2の現状は少々長すぎるという印象を持っています)。--Henares(会話) 2021年12月28日 (火) 07:30 (UTC)
- 相当の期間反対意見がありませんでしたので、先日申し上げました通り特別:差分/75514386における加筆部分をそのまま除去します。コメント依頼と本方針冒頭に記した{{告知}}はこれで終了とさせていただきます。--Henares(会話) 2022年1月8日 (土) 06:18 (UTC)
「Wikipedia:翻訳のガイドライン」確認のお願い
以下の文章は2021年12月17日 (金) 17:20 (UTC)にWikipedia‐ノート:翻訳のガイドラインにIP:27.85.207.229で投稿したものです。こちらの方針にも関係するので確認をお願いします。--27.85.207.103 2021年12月18日 (土) 03:08 (UTC)
以前、初版に翻訳元の記事は示されているものの版指定が書かれていない翻訳記事に対する削除依頼を見かけたことがあります。削除依頼の中で翻訳元の版が指摘されていました。そのときは気づかなかったのですが、このような場合、削除したうえで再翻訳するまでもなく、「版指定を要約欄に記入すればよいだけ」だというのが確認していただきたいことです。それはWikipedia:翻訳のガイドライン#要約欄への記入忘れ・誤記入にある「翻訳投稿の際、要約欄に翻訳元記事へのリンクは書いたが、版指定を忘れた場合」に版指定を追記すればよいと書かれているからです。私自身その下にある「初版で要約欄への記載忘れまたは誤記入をし、他の利用者による以降の編集がない場合」と混同して、他の編集者が編集した後ではこの方法は使えないと思っていたのですが、「他の利用者による以降の編集がない」という条件は付いていないので、他の利用者による以降の編集があっても誰かが版指定を忘れていることに気付いた時点で追記すればよいということになります。おそらく削除依頼者も私と同じ勘違いをしておられたのだろうと想像しています。以上、確認をお願いします。
- あなたが問題にしている削除依頼が適切なものであったかどうか、という点については実際に見てみないとわかりません。こういうものはケースバイケースです。まずは、あなたが見かけたという問題の削除依頼のページを提示してください。--Loasa(会話) 2021年12月28日 (火) 09:29 (UTC)
削除ボタンが「消去」になっている
正確にいつからかはわからないのですが、従来の「削除」ボタンが「消去」に変わっていますよね。
別に大問題で困るというわけではないのですが・・・おそらくこれはWikimedia側でなにか変更をした結果なのでしょうけど(私は技術的なことはわからない)。一瞬戸惑います。なぜ変えた。不必要な変更ではないでしょうか。
難しいことを言えば、管理者マニュアル等との整合性がなくなったり、「削除の方針」を「消去の方針」に変えたり、JAEP内の用語を全部変えなければならないの・・・?(そんなわけない)とか。おそらく日本語の「消去」という語感はいまの「除去」のほうに近く、従来の「削除」(不可視化)に近いとは言えないんじゃないかなあとか。--柒月例祭(会話) 2022年1月3日 (月) 04:08 (UTC)
- 情報 Wikipedia:バグの報告#「モノブック」の外装で「削除」タブの訳が「消去」に変更されていると同一の問題だと思います。--Q8j(会話) 2022年1月3日 (月) 04:13 (UTC)
- 被りましたがそのままWikipedia:バグの報告#「モノブック」の外装で「削除」タブの訳が「消去」に変更されているにもありますが、tranlatewikiで日本語訳を当てる際にこの件のユーザーが既にある対訳を使用せずに「delete」を「消去」と訳したために発生しています。対訳が変わったわけではありません。こちらは修正を上げてもらってますが、反映まで時間がかかります。Vectorでは発生していないのですが、報告ではモノブックでページ右上部のタブの表記で発生していました。もし、別の部分で名称が変わっているなど不自然な部分があれば、バグの報告に「どの部分がどうなっている」と詳細を入れて報告をお願いします。--アルトクール(会話) 2022年1月3日 (月) 04:18 (UTC)
- ありがとうございます。ひとまず、しばらく待つことにします。--柒月例祭(会話) 2022年1月3日 (月) 15:33 (UTC)
ケースGの改訂提案(機械翻訳)
現状ケースG-2は、Google翻訳に全面的に依拠して文章が意味不明な状態のまま放置されているような場合に適用されます。しかし「ですます調」などの表現を微修正し、固有名詞などを整えれば、一見日本語の文章として読めるように見える記事を作るのは簡単です。あまりにも機械翻訳濫用の度が過ぎる利用者は最近のWikipedia:コメント依頼/Keita.Hondaのようにストップをかけられますが、多くの場合うした記事は野放しになっており、時にはメインページ新着記事に選出されてしまう事例も多々起きています。そうした記事は、誰かが翻訳元を読んで全面改訳してくれれば良いのですが、実際には改稿は新たな粗悪翻訳記事の立項ペースに追いついておらず、かといって残された記事を削除しようにもケースG-2を適用できるのか悩ましいところがあり、放置されてしまいがちです。
そこで、ケースG-2の条件を追加あるいは修正し、「後で人力修正が入っているか否かにかかわらず、機械翻訳をベースにしていることが明らかな記事」をケースG-2削除対象とすることを提案します。機械翻訳記事問題をあまりご存じでない方にはいささか乱暴な条件と思われるかもしれないので、想定される質問とその答えをいくつか書いておきます。
- Q. 機械翻訳の進歩は著しいのだから、人が手助け(修正) してやれば何とかんなるのでは?
- A. 確かに10年代前半と比べれば各種機械翻訳は飛躍的に進展しました。しかし百科事典の記事として受け入れるには、正確性も文章力もまだまだとても十分とは言えない水準です。実際のサンプルとして利用者:McYata/儀礼戦争(Google翻訳100%)を作ってみましたので、ぜひご覧ください。これはen:Ritual warfareの本文すべてをGoogle翻訳にかけ出力したものです。少し前に他の方がこれに修正を加えた程度のものを標準名前空間に立項し、新着記事選出相当の得票を得たものの、現在Wikipedia:削除依頼/儀礼戦争にかけられています。一読すれば、「ですます調」を機械的に変換したり名詞を直したりするのではとてもまともな文章にはならないことが分かるはずです。
- Q. Google翻訳は他の機械翻訳と比べて読みにくい代わりに文法的には正確(順序が入れ替わったり単語や文が抜け落ちたりしない)だから、出力文を見ながら頑張って表現を修正すれば問題ないはず?
- A. 程度の問題です。Google翻訳も人力ではあり得ない、誤訳以前のミスを普通にしでかします。上記Google翻訳サンプルページに「ヤノマミ族(「アマゾンの激しい人々」)。」という一節がありますね。これだけ読んで修正を試みるなら「ヤノマミ族(アマゾンに暮らす好戦的な部族)。」あるいは「ヤノマミ族(「アマゾンの激しい人々」という意味)。」などとなるでしょうか。ところがここに該当する翻訳元の英文は、全く違います。履歴継承が面倒なので興味がある方はリンク先を確認していただきたいのですが、英語版の文を正しく訳せば「アマゾンのヤノマミ族(激しい/獰猛な人々と呼ばれている)。」あるいは「アマゾンのヤノマミ族(通称「激しい/獰猛な人々」)」となります。括弧があるので「アマゾンの」の修飾対象は「ヤノマミ族」であるのが明らかですが、Google翻訳はこれすら正しく認識できませんでした。他の一見それらしく訳されている部分も、しっかり英語版を訳して見比べれば、どんなにひどい人力翻訳でもあり得ないとんでもない改変が見つかる可能性があります。つまり、「まずGoogle翻訳にかけ、出てきた日本語を修正する」ことでできた文章に、百科事典の文章として信頼を置くことはできません。
- Q. 翻訳元の文章に目を通して、機械翻訳文の間違っているところは直し、正しい所はそのままにした。これならいいでしょう?
- A. そんなことをする語学力と時間があるなら、最初から機械翻訳無しで自分で翻訳した方が速くないですか?また一度日本語になった機械翻訳文に目を通してしまうことで、その文章が思考の前提になってしまい翻訳元との齟齬を見落としてしまう恐れもあります。あくまでもまず人間が自力で翻訳し、機械翻訳はその確認に使う程度にとどめるべきです。
- Q. 「機械翻訳ベース」なんて何を見て判断できるの?人力で翻訳したらたまたま機械翻訳と似通ってしまうこともあるのでは?
- A. 翻訳の正解は一通りではなく、こなれてくるほど様々な訳し方が現れてきます。きわめて単純な文章1つくらいなら、そのうようなことがあるかもしれません。しかし込み入った説明的文章が、3文も4文も機械翻訳と一致するということは実のところ考えにくいのです。まともに翻訳をしたことがある方はおそらく同意してくださると思いますし、また「異常に似ている翻訳」にはすぐ気づけるものと思います。明文化する際に厳格な判断基準を設けるかどうかは、皆さまの意見を伺いたいです。
- Q. なぜそこまでして削除を求める?機械翻訳記事でも、無いよりはましなのでは?
- A. まず大前提として、不正確であることが明らかである記事が量産されるのは好ましくありません。粗悪な翻訳記事が乱立することでまともな翻訳者は肩身が狭い思いをしていますし、まずもって「こんな酷い文章でもいいんだ」と読者に思われWikipedia全体の信用も低下してしまいます。機械翻訳記事は、やろうと思えば語尾修正込みでも3分で1本「執筆」できます。ネタさえあれば1時間で20本の出鱈目な記事が世に出ることになるのです。他の問題記事よりもはるかにハイペースで、また同レベルのスピードで行われる荒らしよりもはるかに「もっともらしく」すぐに対処に動けないという厄介な代物です。また個人的な感覚ですが、適切な翻訳を行っている利用者は、既存の記事を向上させるよりも、今日本語版にない新たな記事を作る方を優先しがちです。つまり、なまじ機械翻訳で記事が出来てしまうと、それが修正されることもなく延々と残り続ける可能性の方がはるかに高いのです。削除の方針に「機械翻訳ベースの記事」を明記しても、機械翻訳で記事を立てる利用者は後を絶たないでしょう。しかしそのような事態に対し迅速に削除依頼を提出できるようにし、またその立項者に明確に注意喚起をすることができれば、被害の拡大を食い止めるのに役立つはずです。
この提案に対する賛否やコメント、改定案などありましたらぜひお寄せください。--McYata(会話) 2022年3月1日 (火) 14:48 (UTC)
- 賛成 厳格化を強く要望します。単語あるいはワンフレーズぐらいならともかく、一文節以上の規模になりますと、ある程度の精度がある英→日でさえ、そのまま使うには躊躇われる訳が出力されます。自分が専らやっている中→日翻訳ですと、Google翻訳はツールとしては使い物にならないと考えています。最近中国語版からの機械翻訳による新規記事を多く目にしていますが、文体の修正だけでもかなり手間がかかります。加えて日本語を母語としない利用者が多かったこともあり、正直対応を決めあぐねておりました。厳格化しても完全に食い止めるのは難しそうですが、『コンテンツ翻訳
ツール内の機械翻訳機能の廃止』は早急に実現していきたいと考えています。具体的な案が出せなくて申し訳ありませんが、ひとまずコメントとさせていただきます。--Tze Chiang Hao(会話) 2022年3月1日 (火) 15:40 (UTC)下記コメントを受けて『』内の文言を修正。--Tze Chiang Hao(会話) 2022年3月1日 (火) 16:38 (UTC)- コンテンツ翻訳ツールについては、翻訳以外の用途で使用している方もいらっしゃるため、それを廃止というのはいろいろな面でハードルが高そうです。--モーチー(会話) 2022年3月1日 (火) 15:49 (UTC)
- Tze Chiang Haoさん、コメントありがとうございます。ただコンテンツ翻訳については少々誤解なさっている部分があるのではないかと思いますので、コンテンツ翻訳ヘビーユーザーとして説明させてください(本筋から少しずれますが、機械翻訳の議論をする上で認識を共有しておきたいので)。
- コンテンツ翻訳は、翻訳元と自分の翻訳を見比べながら翻訳作業ができるという「対訳支援ツール」です。それそのものは、Google翻訳のような「機械翻訳ツール」とは全く別物です。コンテンツ翻訳内の一機能として、自分の翻訳をGoogle翻訳文からスタートするよう設定できる、というものがあるので誤解されがちなのですが、翻訳元の原文を転写して直接翻訳していく(つまり一般的な翻訳の手順と同じ)設定もできます。私が作った翻訳記事はほぼすべてコンテンツ翻訳で作ったものですし、利用者:McYata/コンテンツ翻訳レビュースペースを見ていただければ、機械翻訳に頼らずコンテンツ翻訳で作成された良質な翻訳記事も少なくないことがお分かりいただけると思います。コンテンツ翻訳内の機械翻訳機能の廃止には同意できますが(Wikipedia:井戸端/subj/コンテンツ翻訳内の機械翻訳機能を制限できないかで提起しています)、コンテンツ翻訳そのものを廃止しろという流れになってしまうと個人的には非常に困ります。--McYata(会話) 2022年3月1日 (火) 16:06 (UTC)
- 現状を鑑みるとやむを得ないと思われますが、G-3として分けた方が良いと考えます。G-2は「日本語/翻訳元言語の初学者が頑張ったけど記事にならなかった」「そもそも機械翻訳なのかどうか以前の問題」「機械翻訳なのかどうか微妙」といった範囲にも網をかけているので、「機械翻訳」であること自体が問題となるのは「現象」が類似していても「検証」「根拠」といった面で大きく異なる方向に発展するためです。全く種類の異なるものを含有して誤用されているケースEの二の舞は避けるべきかと--Open-box(会話) 2022年3月1日 (火) 16:00 (UTC)
- なるほど、これは思いつきませんでしたが妙案だと思います。確かに無理に1つのケースの対象を拡大してしまっては、むしろ範囲があいまいになったり誤用を誘発したりする恐れがありそうですね。現状のケースGの説明では機械翻訳放置について「上記の規定により削除の対象」としていて、なぜ明確にG-2の範囲で説明していないのかと疑問に思っていたのですが、元から分けて考えた方が見通しが良くなりそうですね。--McYata(会話) 2022年3月1日 (火) 16:12 (UTC)
- コメント 賛成よりです。機械翻訳についてはWikipedia:翻訳のガイドライン#機械翻訳に解説があるので、齟齬が発生しないように両者の歩調を合わせて改訂していくように留意願います。
- 「なぜそこまでして削除を求める?機械翻訳記事でも、無いよりはましなのでは?」の回答なのですが、機械翻訳の記事でよいのなら、その原文の記事を読者が機械翻訳で読めば済む話です、ということになろうかと思います。機械翻訳の結果をコピペした記事や、機械翻訳の特徴が残っている記述は、ライセンスにかかわらず(つまり、著作権上の問題がないとしても)作成・記載不可という方向で問題ないかと思います。過去にはスコットランド語のWikipediaで7年間に渡り大量の誤訳を発生させた事例があり([2])、機械翻訳も同様の問題をはらんでいるという認識です。
- McYataさんに2点確認ですが、この方向で改訂がなされたと仮定して、
- 改訂前に記述された内容にも遡及して適用させる想定か、改訂後の記述に限って対象とする想定か、どちらになりますでしょうか。
- 機械翻訳ベースの記述をそうでない記述に編集で置き換えた場合、機械翻訳ベースの記述がある履歴を版指定削除する想定でしょうか。
- 自分もどちらが適切か判断がつかないですし、議論の進め方によっては削除ではなく編集対応とすることも考えられるかと思います。よろしくお願いします。--Tamago915(会話) 2022年3月1日 (火) 16:10 (UTC)
- Tamago915さん、ありがとうございます。書き忘れていましたが「自分で機械翻訳すればいい」というのは本当に仰る通りで、特にGoogle Chromeなら英語版を閲覧しながらページ全体に翻訳を書ければ読めるものと同じレベルの機械翻訳文を、さも日本語版にふさわしい正式な日本語記事であるように公開されるのでは意味がないと思います。
- いただいたご質問について。
- 可能な限り改訂前のものにも遡及して対象とできればと考えています。利用者:McYata/コンテンツ翻訳レビュースペースではすでに数多くのGoogle翻訳ベース記事が発見されておりますので、これらを簡潔な依頼文だけで削除依頼に送ることができればかなり楽になると思います。他にも粗悪な翻訳記事をよくよく調べたら機械翻訳だった、というケースは色々見つかると思うので、立項時期にかかわらずそれらもWikipedia日本語版にふさわしくない記事として削除したいというのが個人的な願望です。ただ実際には機械翻訳ツール側も日々変化しており、昔に作られた機械翻訳記事が今の機械翻訳では再現できない例も出てくるでしょうから、遡及には技術的限界があるだろうと思います。あくまでもさかのぼれる範囲で、ということで。できるだけ立項直後に検証した方が精度が高まるので、今後の機械翻訳記事の洗い出しの場としてプロジェクト:翻訳検証を立ち上げようとも考えています(プロジェクト‐ノート:翻訳にて提起中)。
- 使われた機械翻訳ツールにもよりますが、版指定削除は必要ないと考えています。Google翻訳などはコンテンツ翻訳内で提供される限り自由に利用できるとされているので(Wikipedia:翻訳のガイドライン#機械翻訳の著作権)、版指定削除してまで不可視化する必要はありません。DeepL翻訳などはWikipediaの文章に使用するとライセンス違反の恐れがあるので版指定削除が必要になりますが、その場合はケースGではなくケースBで対応可能です。
- 私としては、人力による全面改訳がなされればその瞬間に削除の必要はなくなると考えています。これは現行のG-1やG-2でも同じです。ただ現実問題、編集対応が追い付いていないので、より迅速に、かつ立項者に強い警告を出せるように削除規定も設けられたら良いという考えです。--McYata(会話) 2022年3月1日 (火) 16:29 (UTC)
- McYataさんへ、正しい用語を使わなかったために変な誤解を生んだようで申し訳ありません。そうです。片側で勝手に機械翻訳を出力してしまっている機能のことを言いたかったのです。よってコメントは修正いたしました。--Tze Chiang Hao(会話) 2022年3月1日 (火) 16:38 (UTC)
- 方向性としてはもちろん賛成なのですが、「機械翻訳に由来すると考えられる誤訳が複数残存している記事」としたほうがよいのではないでしょうか。McYataさんのようにこの問題に詳しい方であれば機械翻訳であるか否かをかなりの精度で見分けられると思いますが、削除依頼に参加する多くの利用者はそうではありません。嫌がらせで削除依頼が提出されるという事例もありましたし、機械翻訳でないものが誤認されて削除されるということは絶対に防がなくてはいけません。「機械翻訳をベースにしていることが明らか」という基準はかなり抽象的で個人の判断に依存する余地が多すぎるため、ある程度の絞りをかける必要があると思います。そこで勘案するに、誤訳が偶然似てしまう確率は正しい訳が偶然似てしまう確率よりも低いと考えられること、誤訳が見つかっていないのであれば削除する必要性がそこまで大きくないことから、「この部分の誤訳は機械翻訳由来と考えられる」という具体的な指摘を伴ってはじめて有効な削除依頼と考えるのが良いのではないでしょうか。--WhiteSpaceCoder(会話) 2022年3月2日 (水) 03:15 (UTC)
- お疲れさまです。へのいちと申します。
- この、翻訳作業に問題があるケースを削除する方針は、2019年頃の提案に基づいたものなのですね。私はアクセス頻度が低いので、把握していませんでした。今回のMcYataさんの提案に触れるまであまり意識してきませんでしたが、たしかに機械翻訳された記事は酷いですね。これをウィキペディアの正規の解説記事ページとして公開することはとても認められないと思います。そのための対処方法として削除の方針に基づき削除できることを明確化しようというのは理解できます。ただ、これはそもそも2019年頃に導入された現行の扱いについてもいえるのですが、機械翻訳などの翻訳品質の低さによって結果的に記事の品質が低くなっているというものについては、「削除」ではなくて「白紙化」等による対応でも十分ではないかと思います。上で例に挙げられているような「誰が見てもすぐおかしいことがわかる機械翻訳の成果物のようなもの」については、見つけた人が「翻訳品質が低すぎて日本語の記事として成立していないため白紙化」とでも書いて白紙化してもおとがめなしでしょう。とがめだてして差し戻そうとする人にこそ、翻訳し直したり新たに書き起こしたりする必要が出てくるわけで、品質の低い翻訳もどきの記事が公開されるという状態は回避できます。削除依頼などの手間暇をかけて削除に持ち込む必要性は薄いでしょう。これがもしも、「白紙化された青リンク記事であるよりも記事の不存在を示す赤リンクのほうが新規立項を促す効果があって望ましい」というような理由でもあるのであれば、「削除」する必要もあるかもしれませんが、私はその必要はあまり感じません。運用面から見ても、削除の方針によって削除プロセスにのせる基準として、日本語記事としての品質の低さという誰が見てもわかる外形的な判断基準でなく、機械翻訳を利用したかどうかという原理的には「中の人」しか知ることのできない事柄を判断基準に据えるというのも筋が良くなさそうに思います。
- あと、まったく論点が変わりますが、この問題については、低品質の翻訳記事ができた後にどう対処するかということも大切ですが、上でMcYataさんが指摘してくれているような、機械翻訳による記事乱造がどれほどウィキペディアの品質を下げる結果になるのかということが、もっと広く理解されることによって機械翻訳による記事を作成する人がいなくなるのが理想的です。Tamago915さんが指摘されたWikipedia:翻訳のガイドラインのようなところも活用して広めていきましょう。この問題はウィキペディアにおける「常識」のようになってほしいものですね。(いや、私が疎かっただけですが・・・ごめんなさい)--へのいち(会話) 2022年3月2日 (水) 04:25 (UTC)
- コメント 賛成寄りです。但し、その適用条件、すなわち「機械翻訳をベースとしている」は具体的に詰める必要があると思います。これについては、誤訳を軸に見ていくのがよいかとは思います。
- 現状のケースG-2の問題点として、「日本語になっている部分が、日本語版での記述として意味のあるものになっていれば、存続としてください。」というところがあると思っています。最近の機械翻訳の性能向上は著しく、特に外形的にすぐにわかる文法的な正しさであったり、自然に読める意味の取れる翻訳文を生成する、というところはかなりよくなってきています。一方で、文脈を把握するような学習を重視するために、細かく見ていくと訳抜けが生じたりすることもありますし、また、ニュアンスを汲み取った適切な単語選択というのは機械翻訳の苦手とするところです。そして、最近機械翻訳の記事で問題とされているのは、日本語の文章としてみると何らかの意味が通ってしまう文章が記事全体にわたって続いているが、部分的に致命的な誤訳があるだとか、専門用語の選択に問題がある、といったことです。機械翻訳結果だけをベースに記事を立てるのは、明らかに品質の問題があると推定される一方で、なまじ機械翻訳の性能がある程度上がってきているために、一見すると「日本語としては意味が通ってしまう」ため、ケースG-2の適用が悩ましくなってしまっています。この問題を解消するために、「機械翻訳をベースとしていることを根拠として、百科事典の記事として相応しくない誤訳が含まれていることを推定して削除することができるようにする」、今回の提案は有用だと思います。(本当は改稿するのがベストで、最低でも、知見がある人が記事を確認して、ちゃんと致命的な誤訳を指摘するだとか専門的な単語選択に明らかに誤りがあることを明らかにして削除するべきなのでしょう。しかし、現状では利用者:McYata/コンテンツ翻訳レビュースペースを見ていただけるとわかります通り、コンテンツ翻訳された記事の最低限の品質チェックすら、新規立項に追いつきません。そうした「査読」のような対応を望むフェーズはもう過ぎていて、今は立項側の対応を求めるべき段階です。) --紅い目の女の子(会話/履歴) 2022年3月2日 (水) 05:30 (UTC)