Wikipedia:井戸端/subj/雑談・あまりにも低質な翻訳記事を白紙化する!というのはどうか
|
雑談・あまりにも低質な翻訳記事を白紙化する!というのはどうか
[編集]井戸端なので、気楽な雑談として。
低質にすぎる翻訳記事を、ほぼほぼ白紙化することに、正当性をあたえるルールをつくるというのはどうだろうか、という雑談です。
- たとえばこんな感じ
- 「翻訳記事の品質に著しい問題がある場合、誤った情報を広めてしまうリスクがあります。このような場合には、適切な情報源で確かに裏付けられる最小限の情報だけを残して、除去するかノートへ移しても構いません。」
かなり以前から翻訳記事については様々な問題が起きていて、止む気配がありません。しばしば「質が低すぎる・機械翻訳」記事を削除しようという話が出ます。が、機械翻訳に関わる著作権上の問題があるケースを除いては、単に翻訳が低質だという理由で記事を削除するのは無理筋です。
とはいえ、明らかにおかしい訳語が満載だったり、明らかに日本文として意味が通らない翻訳記事は、ちょっとどうかと思うのです。まがりなりにもWikipediaは知的プロジェクトですから、根拠のない機械翻訳による訳語や、大半が信頼できる情報源に基づいていない記事などは、「有害だ」とさえ言えると感じます。
そこで、そういうのはもう白紙化しちゃえ!というのはどうでしょう。正確にいうと、最小限の定義文(適切な出典を付すのが望ましい)を残して、大半を除去するということです。現状、そういうことをすると、大幅なバイト数の減少=記事破壊、とみられがちです。それはまあわかります。わかりますが、でもきちんと調べて出典をつけて改稿するのは、なかなか現実的ではないということも多いです。
原則、検証可能性の観点から、出典がついていない文章や独自研究は除去されても文句は言えないことになっています。適切な調べ物に基づかない・機械翻訳による術語の訳語は「独自研究」とみなすことはできるのでは・・・
- 情報源の問題や独自研究など翻訳元(多くは英語版)自体に問題がある場合
- 翻訳元の問題はそう大きくなさそうだけど翻訳がヤバいという場合
- 記事名自体が翻訳怪しい場合
- 個別参照法が採用されていない場合(ジェネラル・リファレンス方式で、末尾に参考文献リストがあるだけという場合)
とても非生産的な話なのですが・・・--柒月例祭(会話) 2021年2月7日 (日) 11:36 (UTC)
- 井戸端でも雑談はNGでしょう。目的外利用なので解散。
- ……というのはともかく、率直なところ、「雑談」という名目で腰を据えた議論から逃げようとするのは好きではないですね。
- きちんとした形で議論提起するか、難しいようなら一旦取り下げるか、していただくほうが議論は進むと思います。--Tamago915(会話) 2021年2月7日 (日) 13:26 (UTC)
- まずWikipedia:検証可能性の「出典のない記述は除去されても文句は言えません」ですら機能していません。これ以上、なになにを除去してよい、という方針を付け加えたところで、機能はしないでしょう。本来この方針は「こう書けばどの記事にも出典が示された方向に収束していくだろう」と考えて書かれたものだと思います。しかし、現実はそうなっていません。Wikipedia:コメント依頼/IP群による2005年の剽窃案件の記事なんて、出典が示されていないのですから、この方針が機能しているなら過去版を隠すだけで済みました。しかし、実際はほとんどが2005年から最新版まで版指定削除です。首相経験者だの、国会議事堂だのが15年放置されているのに、低質翻訳をどうにかできるとは考えづらいです。
また「これは翻訳だ」「低質だ」というのは客観的に決まりませんので、これらを条件とする方針はまわらないと思います。例えばフランソワ・フェヌロンが翻訳記事だと客観的にわかるでしょうか。ノートにも書いているように私は翻訳かつ誤訳が入っていると思っていますが、これには議論の余地があると思います。なぜ自分で書き直さないかと言うと、文献を全部買う以外に対処の方法がないからです。今この状況で、低質翻訳除去方針により除去、と要約に書いてノートに記述を移したらどうなるか。「除去荒らし」「低質じゃない」「翻訳じゃない」などと非難が集中して、私はブロックされることでしょう。まだ文献がないのだから、私は抗弁することもできません。そんなリスクをおかすのなら、いつか自分で文献を揃えて書き直せる日まで待った方がよいと考えます。
最後に全然別の観点ですが、中学生が頑張って翻訳したようなのは、できればわかる人が直してあげて、人を育てた方がよいと思うのです。次の日に見たら「低質翻訳除去方針により除去」と書かれて消されていたのでは、活動を続ける気がなくなると思います。「今ウィキペディア日本語版にはそれをやれる人数はいないんだ」と言われればそれまでですので、この観点は無視してもかまいません。--西村崇(会話) 2021年2月7日 (日) 14:57 (UTC)- 私も辺境の方とかにいくとトンネルは2006年に完成予定とかいう文章が出てくるのはどうかと思っていましたけれども、そもそもの問題として熟練の利用者が少ないというのはあるかもしれません。現在毎日数百人の利用者が登録していますが、そのうち拡張承認されるのはよくて一日一人が良いところです。また、英語のできる利用者は多くてもフランス語とかロシア語ができる利用者は少ないので結果的に機械翻訳に頼らざるを得ないというのはあると思います。--Kameda kakinotane(会話) 2021年2月8日 (月) 09:12 (UTC)
- Template:Rough translationやTemplate:出典の明記などに上位互換を作成し、テンプレート貼り付けから一定期間をもって大幅除去を行う、というのはどうでしょうか。大幅な記述の除去はノートでの事前合意が推奨されていますが、それを記事本体での定型文で代替する、というイメージです。対象は翻訳記事に限定せず、予告期間を設けることで客観的判定とモチベーション低下の問題を(後者は多少ですが)クリアできるのではないかと思います。
- 翻訳記事、特に翻訳自体に問題がある記事に関しては大幅除去ではなく、削除がより適切であるような気もするのですが。英語版の話にはなりますが、en:WP:MACHINEには
Wikipedia consensus is that an unedited machine translation, left as a Wikipedia article, is worse than nothing. (This is partly because translation templates automatically carry links to machine translations, so readers can easily access machine translations anyway—pasting a machine translation into an "article" really achieves nothing).
という文言があります。ブラウザにも機械翻訳が備わっていたりもするので無益ですし、定義文だけが修正されて存在していても直接他言語版に飛ぶ妨げになるというデメリットを上回るかどうか。--YTRK(会話) 2021年2月8日 (月) 13:27 (UTC)
- 私も辺境の方とかにいくとトンネルは2006年に完成予定とかいう文章が出てくるのはどうかと思っていましたけれども、そもそもの問題として熟練の利用者が少ないというのはあるかもしれません。現在毎日数百人の利用者が登録していますが、そのうち拡張承認されるのはよくて一日一人が良いところです。また、英語のできる利用者は多くてもフランス語とかロシア語ができる利用者は少ないので結果的に機械翻訳に頼らざるを得ないというのはあると思います。--Kameda kakinotane(会話) 2021年2月8日 (月) 09:12 (UTC)
- まずWikipedia:検証可能性の「出典のない記述は除去されても文句は言えません」ですら機能していません。これ以上、なになにを除去してよい、という方針を付け加えたところで、機能はしないでしょう。本来この方針は「こう書けばどの記事にも出典が示された方向に収束していくだろう」と考えて書かれたものだと思います。しかし、現実はそうなっていません。Wikipedia:コメント依頼/IP群による2005年の剽窃案件の記事なんて、出典が示されていないのですから、この方針が機能しているなら過去版を隠すだけで済みました。しかし、実際はほとんどが2005年から最新版まで版指定削除です。首相経験者だの、国会議事堂だのが15年放置されているのに、低質翻訳をどうにかできるとは考えづらいです。
- コメント 当方も英語版から日本語版への翻訳記事をいくつか作っていますが、英語力がたかが知れているレベルなので機械翻訳に頼ることはあります。なので「低質にすぎる翻訳記事」というのがどのレベルなのかというのを想定しておられるのかが気になるところです(個人的には「機械翻訳そのまま」はさすがにちょっと…とは思っていますが)。
- で、基本的には「白紙化」の前に告知テンプレートの掲出があればかなり改善するのかな、とは思っていますが(ニュアンスとしては最初の㭍月例祭さんのコメントそのままで)。そこから加筆しようと思えば加筆されるでしょうし、これは…と思われれば削除依頼にかけられるのでは無いかと思っていますが(削除の方針として「ケースG」というのも存在するわけですし)。--Bsx(会話) 2021年2月10日 (水) 09:34 (UTC)
コメント こんにちは。(1)「低品質」は翻訳に限った話では無いと思います。(2)「白紙化」というか、Wikipedia:ページの編集は大胆にのガイドもあり、Wikipediaは成長する(皆で育てる)を目的(理想)とした百科事典と思うので、「500行の低品質記事」を「5行のまともな記載」に置き換える事は、立派な改善と思います。(3)「荒らし」扱いですが、私は全文書き直しを何回もしましたが、事前にノートで理由や修正方針を具体的に書いて時間を置き、議論には説明すれば、誤解された事はありません。(4)テンプレート等は既存で可能で、問題は単に改善の手間で、誰かが一括改善プロジェクトの旗を振るのは良いですが、最終的には気づいた人がコツコツ改善する以外に無いのでは(命令系統なきボランティア集団なので)。(5)なお「出典のない記述は除去されても文句は言えません」は「無出典は記載禁止(=単純一律削除)」ルールではなく、「他ユーザーの判断次第では消されても、文句は言えない(=なるべく正当性の根拠となる出典を付けましょう)」の意味で、ガイドとして一応機能しているかと思います(充分とは思いませんが)。--Rabit gti(会話) 2021年2月11日 (木) 04:40 (UTC)
- コメント まず㭍月例祭さんのあげられたケースですが、(1)の翻訳元に問題があるケースは日本語版の記事と同様に削除依頼か改稿が適切であり、翻訳とは別の問題でしょう。(4)のジェネラル・リファレンス方式の記事は古いものや個別参照法が定着していない言語版には多々あり、特段の処置を講ずる理由にはなりません。残る(2)(3)は、(3)に改名を伴うだけで「翻訳品質」に係わる同根の問題です。基本的に機械翻訳放置はG-2、同レベルの日本語になってないものもG-2ですが、それよりはましなレベルとして考えますと現状では改稿しか無いと思われます。そしてその改稿の中にRabit gtiさんがあげられた「少量のまともな記載による置き換え」によるスタブ化はあっても良いと考えます。
- 総論・各論については井戸端なので適当に書き連ねてみますと、機械翻訳が悪いのではなく、機械翻訳を使いこなせない利用者にも気軽に使わせてしまう「コンテンツ翻訳」が悪いんです。そこにDeepL、みらいの使えない2強(共に翻訳結果のライセンス表記無し、別途有料サービス存在)が拍車をかけていますね。ただ、90%案ですら財団への提案に移せなかったので、規制は難しいですし、日本語版独自で制限するために記事の作成権限に拡張承認を要求する(自動承認以下だとすり抜けます)のは無理があるでしょう。加えて、これは翻訳に留まりませんが「ケースBの蓄積」が欠けているように思われます。
- ここ1年以上機械翻訳を含む変な翻訳への対処に追われてまともに執筆できていないので正直なところ心情だけでしたら賛成したいんですが、「白紙化」は閲覧者には利益がなく、執筆する利用者には感知されにくく、問題行動を行った利用者にはなんら影響がないと得るところが全くないので選択してはならない手法であると考えます。「白紙化」するほど現状が悪いなら削除の方針へG-3として低質翻訳の追加を考えるか「スタブ化」であるべきでしょうし、削除の方針に盛り込んだとしても、「スタブ化」は有効な対処であると考えます。またその際にはTemplate:Rough translationのようなものは役に立ちそうです。
- 特定の利用者により乱造される場合は「人への対処」を検討した方がいいと考えます。記事という出口だけで対処するのは無理があり、問題のある記事を乱造する利用者という入り口を絞ることも必要でしょう。ただ、翻訳のみで問題を起こした利用者は「それでも続ける」「フェードアウト」「改善」と揃っていますが低質翻訳単独でのブロックって思い当たらないんですが。
- 人手と記事の増加ペースに余裕があれば、改善方向へ導くのが一番いいので、その点からもあまり厳しい対処は取りにくいのはありますね。--Open-box(会話) 2021年2月14日 (日) 16:29 (UTC)
- コメント せめてコンテンツ翻訳を自動承認された利用者にのみ利用できるようにすれば(アウトリーチイベントは「承認された利用者」の権限を予め申請する)ある程度は減らせると思います。特に日本語を解さない利用者が機械翻訳のみで適当に投稿しているケースへのピンポイント対処でかなり役に立ちます。したがって、すり抜けがあっても実施する価値はあると考えます。(一応、過去議論へのリンクを貼っておきます:Wikipedia:井戸端/subj/コンテンツ翻訳ツールにおける日本語への機械翻訳をツール側で禁止する提案)--ネイ(会話) 2021年2月19日 (金) 11:15 (UTC)
- コメント「自動承認された利用者」であれば、LTAの寝かしアカウントのように適当な編集を10回やってしまえば使える様になってしまいますので、「拡張承認された利用者」の方が良いかと思います。--58.188.253.160 2021年2月19日 (金) 15:27 (UTC)
- コメント 機械翻訳関係は大抵ライセンス問題で削除対象になるので、唯一の穴であるコンテンツ翻訳を塞ぐことで得られる効果は大きいものだと思います。緩めの自動承認とするか、英語版に倣って厳しめの拡張承認とするかは悩みどころです。--YTRK(会話) 2021年2月22日 (月) 12:12 (UTC)
- コメント 以前自分が立項した記事を英語版に移出しようとした際に、英語版の編集回数が足らずコンテンツ翻訳を使えず、内部リンクやテンプレートの翻訳の手間を考えて保留した経験があるので、英語版と同等の拡張承認された利用者とまでするのは、少々デメリットが大きいかなと感じます。--Jutha DDA(会話) 2021年2月22日 (月) 12:53 (UTC)
- コメント せめてコンテンツ翻訳を自動承認された利用者にのみ利用できるようにすれば(アウトリーチイベントは「承認された利用者」の権限を予め申請する)ある程度は減らせると思います。特に日本語を解さない利用者が機械翻訳のみで適当に投稿しているケースへのピンポイント対処でかなり役に立ちます。したがって、すり抜けがあっても実施する価値はあると考えます。(一応、過去議論へのリンクを貼っておきます:Wikipedia:井戸端/subj/コンテンツ翻訳ツールにおける日本語への機械翻訳をツール側で禁止する提案)--ネイ(会話) 2021年2月19日 (金) 11:15 (UTC)
コメント 別件でも触れたのですが、en:Wikipedia:Draftsを参考に「草稿」名前空間を作って、一定の基準を満たさない記事については(翻訳であろうがなかろうが)議論を経ずにそちらに移せる、という規定を設けるというのはいかがでしょうか?利点としては
- 削除や白紙化よりも、記事の改善を促しているということが分かりやすく、初心者を含めた執筆者の意欲を削ぎにくそう
- 議論を経る必要がないことにすれば、「削除依頼」のように問題のある記事がしばらくの間残り続けることもない
- 削除と異なり、移動権限のある利用者であれば実行できるので、管理者・削除者の負担にはあまりならない
- 同様に、(草稿名前空間に移動するという)判断に誤りがあった場合のリカバリーも容易
- 以上のように比較的カジュアルに利用できる(もちろんこの点に起因するデメリットもありそうですが)ので、「問題はあるけど削除するほどでは……」といった案件への対応の選択肢が増え、有耶無耶になる場合を減らせそう
といった辺りが考えられます。また以上は、標準名前空間からの移動についての話になりますが、en:Wikipedia:Draftsの本来の目的であると考えられる投稿前の下書き用空間としても、それなりに活用機会はあるのではないかと考えております。
私もまだen:Wikipedia:Draftsについてちゃんと調べたわけではないので、とりあえずこういうものもあるよ、ぐらいのつもりの発言ととらえてもらえればと思います、以上です。--Jutha DDA(会話) 2021年2月15日 (月) 05:07 (UTC)
コメント 話の主旨とは少し外れますが、たとえばストリートファッション、日本のストリートファッションのような中途半端な翻訳記事を、日本語文献を元に一から書き直したいと思った場合、どのような手続き(ノートでの提案とか、告知とか?)をすれば良いものでしょうか? 私の場合、日本語以外はお話にならないレベルですので、翻訳記事を翻訳として成長させるという方法は取れそうにありません。けれど曲がりなりにも出典が付いていたりするので勝手に除去するわけにもいかず、こういう場合はどうすればいいのか悩んでいました。--ねこざめ(会話) 2021年2月17日 (水) 17:49 (UTC)
- コメント 翻訳記事を翻訳記事のまま残さねばならないということはないので、通常の項目と同じように然るべき出典を用いて加筆すればいいのでは無いかと思いますが。逆に然るべき出典を用いてしっかりした記述で加筆できれば、他言語版が日本語版を参考に加筆することもあるかも知れません。--Bsx(会話) 2021年2月17日 (水) 22:27 (UTC)
- コメント コメントありがとうございます。確かにおっしゃる通り、通常の記事と同じように編集すれば良いことであって、どうやら自分の外国語に対する苦手意識と、翻訳に対する尊敬と憧れみたいなものが邪魔をしているだけのようでした。これからはあまり構えずに、記事を良くすることを主眼において、ちょっとずつ手を出してみようと思います。--ねこざめ(会話) 2021年2月18日 (木) 22:25 (UTC)