一部のスキャナで「勝手に原稿の数字を書き換える」エラーが出ることが明らかに
コピー機やスキャナで取り込んだ書類は原本と100%まったく同じ内容になるはず。しかし、最近のスキャナでは画像をより美しく圧縮するアルゴリズムが誤作動し、原稿の中の数字を勝手に書き換えてしまうという恐ろしいエラーが起こるのだそうです。
問題が発覚したのは、こちらの建築図面をスキャンして画像化した時のこと。
一番上の欄の3つが元の画像です。二段目はXerox WorkCentre 7535。三段目以降はXerox WorkCentre 7556でスキャンしたものです。赤丸がエラー位置。単なるスキャンつぶれではなく、明らかに違う数字に書き換えられているのが分かります。7535では毎回同じ位置にエラー、7556ではランダムな位置にエラーが出ました。
こちらは「6」が「8」になっているのが、よりはっきりとわかります。
ランダムな数字で検証した結果がこちら。
多くの白黒コピー機/スキャナでは元原稿を画像化する際、「JBIG2」というアルゴリズムを用います。これはテキスト原稿を白黒2色でスキャンするのに特化したもので、原稿の内容を認識・パターンマッチさせ、文字や数字をくっきりさせる仕組みになっています。
このエラーはスキャナで取り込む際に、画像の圧縮設定を「TIFF(圧縮なし)」に設定すると発生しなかったとのこと。このことから圧縮アルゴリズムになんらかの原因があると考えられています。
ソース:Xerox scanners/photocopiers randomly alter numbers in scanned documents · D. Kriesel
トップ画像:Jul12583 | Flickr – Photo Sharing!
関連記事
あのトラウマがよみがえる……!Internet Explorerの「あのエラー」をJavaScriptで見事に再現 - DNA
可愛すぎる「FireFoxで予期せぬWindowsエラーが発生しました」動画が海外ネット掲示板で人気に - DNA
表示するページが無いときなどに表示されるクリエイティブな「404エラー」ページ13選 - DNA
130年前のレコードの中の音を、光学スキャンで読み取り・再現することに成功 - DNA
Googleの新プロジェクト開始か、「reCAPTCH」に「ストリートビュー」の画像が出てくるように - DNA