Wikipediaの「たった1種の文法ミス」を直し続けて約5万記事を修正してしまった男
日本語でも「シュミレーション(誤)とシミュレーション(正)」や「『こと』と『事』の使い分け」など、書き分けが適当な人はたくさんいるもの。こうした適当なものを見つけるとイラっとしつつも放置してしまうものですが、Wikipediaの編集者の中には、たった一つの凡ミスを約5万記事に渡り修正し続けている人がいるそうです。
1時間あたり800万回閲覧されると言われている英語版Wikipediaのページは、すべて無償のボランティアが執筆を行っているのはご存知の通り。内容の質に疑問を呈する声も多いのですが、英語版は話者の数に比例してマトモなページが比較的多いと言われています。
とはいえ、ページが増えると「よくあるミス」も増えるもの。中でも「Comprise of(~を含んで成立する)」は文法的にもスタイルガイド的にも不適とされているのですが、「consists of」「be composed of」(いずれ「も~から成り立つ」)と意味も見た目も似ているためよく見受けられます。
例えば「Wikipediaのコミュニティは多くの興味深い人によって構成されています」という文を英語で書くとこうなります。
こちらは誤用。「comprise of」はダメです。
The Wikipedia editorial community is comprised of many interesting people.
これなら文法的にはOK。
The Wikipedia editorial community comprises many interesting people.
だいたいこういう風に書くことが多いようです
The Wikipedia editorial community consists of many interesting people.
The Wikipedia editorial community is composed of many interesting people.
瑣末なミスですが、間違いは間違い。Wikipediaの編集者「giraffedata」ことコンピューター・エンジニアのブライアン・ヘンダーソンさんは「comprise of」の誤用に関する6000語のエッセイを掲載し、このたった一つの誤用を約5万記事に渡って修正し続けています。
作業手順は以下のとおり。まず毎日Wikipediaを検索し「Comprise of」が含まれるページを検出します。同じ記事を何度も修正すると怒られるので、自分のDBに残した履歴と照合して自分が以前に修正したことがあるページを除外し、自分のサイトに掲載しています。そこまでやれば修正もプログラムで自動化できそうな感じもしますが、文脈に合わせるため修正はすべて手作業とのこと。
時には「細かいことをブツブツ言いやがって」という不注意な編集者達がイライラして管理者に苦情を上げたりすることもあるそうです。正義を貫くのはどんな小さなことでも大変なものですね。
ソース:Meet the Ultimate WikiGnome — Backchannel — Medium
関連記事
Wikipediaの見た目をモダンに変えスピードアップさせるWebサービス「WikiWand: Wikipedia Modernized」 - DNA
Wikipediaが更新される様子を雨だれのように可視化するWebサービス「Listen to Wikipedia」 - DNA
Wikipediaの「○○国の歴史」に一番よく出てくる単語で描かれた世界地図「Laconic History of The World」 - DNA
70年代に「英語そっくりだけどぜんぜん英語じゃない歌」で大ヒットしたイタリア人歌手がいた - DNA
東欧の響き、ハンガリアン・フォークダンスでクイックソート法が楽しく理解できる動画 - DNA