科学と技術

一部のスキャナで「勝手に原稿の数字を書き換える」エラーが出ることが明らかに


コピー機やスキャナで取り込んだ書類は原本と100%まったく同じ内容になるはず。しかし、最近のスキャナでは画像をより美しく圧縮するアルゴリズムが誤作動し、原稿の中の数字を勝手に書き換えてしまうという恐ろしいエラーが起こるのだそうです。


問題が発覚したのは、こちらの建築図面をスキャンして画像化した時のこと。

一番上の欄の3つが元の画像です。二段目はXerox WorkCentre 7535。三段目以降はXerox WorkCentre 7556でスキャンしたものです。赤丸がエラー位置。単なるスキャンつぶれではなく、明らかに違う数字に書き換えられているのが分かります。7535では毎回同じ位置にエラー、7556ではランダムな位置にエラーが出ました。

こちらは「6」が「8」になっているのが、よりはっきりとわかります。

ランダムな数字で検証した結果がこちら。

多くの白黒コピー機/スキャナでは元原稿を画像化する際、「JBIG2」というアルゴリズムを用います。これはテキスト原稿を白黒2色でスキャンするのに特化したもので、原稿の内容を認識・パターンマッチさせ、文字や数字をくっきりさせる仕組みになっています。

このエラーはスキャナで取り込む際に、画像の圧縮設定を「TIFF(圧縮なし)」に設定すると発生しなかったとのこと。このことから圧縮アルゴリズムになんらかの原因があると考えられています。

ソース:Xerox scanners/photocopiers randomly alter numbers in scanned documents · D. Kriesel

トップ画像:Jul12583 | Flickr – Photo Sharing!

関連記事

あのトラウマがよみがえる……!Internet Explorerの「あのエラー」をJavaScriptで見事に再現 - DNA

可愛すぎる「FireFoxで予期せぬWindowsエラーが発生しました」動画が海外ネット掲示板で人気に - DNA

表示するページが無いときなどに表示されるクリエイティブな「404エラー」ページ13選 - DNA

130年前のレコードの中の音を、光学スキャンで読み取り・再現することに成功 - DNA

Googleの新プロジェクト開始か、「reCAPTCH」に「ストリートビュー」の画像が出てくるように - DNA

この記事をブックマーク/共有する


前後の記事

DNAをこれからもよろしくお願いします!

Facebook上のコメント一覧

Twitter上のコメント一覧