N/A

デジタルデータの2つの顔

ここ数回のテーマは“紙に定着されてしまった情報は共有化が難しい。故に、情報を紙から引きはがし、デジタルデータという形で誰もが自由にアクセスできるような蓄積保管する仕組みを作らなくてはならない”だ。最初からデジタルデータで作ってしまえば話は早いのだけど、情報の種類によってはなかなかそうもいかない。ならば、紙で作ったものをデジタルデータに変換するという、次善の手を考えよう、ということ。
もちろん、デジタルデータにすれば情報は共有化できるのか? データベースにすればそれでOKなのか? あるいは、そもそも“情報の共有とは具体的にどういう状態を指し、それによって何が可能になるのか?”…と、疑問はいくらもでてくるのだけど、それはおいおい考えていくことにするとして、とりいそぎ、“アナログデジタル・コンバータ”として機能するデバイスについて簡単に説明しておきたい。

画像データかテキストデータか

ここでいう“アナログデジタルコンバータ”には、大別して画像データにするものとテキストデータにするものの2種類ある。変換の順序としては、まず画像データにして、次にその画像データをテキストデータに変換することになるので、2種類というよりは2段階と呼ぶべきかもしれないが。
紙のメモをスキャナでスキャンすれば、ディスプレイで見ることができるし、コピーすることもメールに添付することもできる。その意味ではたしかにデジタルデータなのだが、スキャンした紙のメモに書かれた文字は“画像データ”だから、コンピュータには何が書かれているのかわからない。コンピュータがわかるのはせいぜい“いつ作られたファイルなのか”“サイズはどの程度なのか”といったファイルそのものについての情報だけだ。という意味では半分だけデジタルデータになった状態だと言える。
この画像データとしての文字をコンピュータに読めるテキストデータにするためのソフトウェアがOCR(光学式文字読み取り)ソフトだ。テキストデータにしてしまえばファイルサイズは小さくなるし、複数のファイルを対象に全文検索を掛けることもできる。いいことずくめなのだが、OCRの認識率は上がったとはいえ100%ではない。つまり必ず読み間違いが発生するから、正確なデータにするためには必ず人間がチェックしなければならない。
画像データをOCRで変換してやっと一人前のデジタルデータになるのだが、OCRによる読み取りと結果チェックのためには、それなりの時間と労力…僕の経験から言えば“相当の時間と労力”を要求される作業だ。だから、たいがいのもの、たとえば、ミーティング時に配られたレジュメや報告書などはOCRには掛けない。掛けるのはどうしてもデジタルデータにしなければならないもの、たとえば、元原稿が手書きでデジタルデータが存在しない雑誌原稿、あるいはデジタルデータはあるのだが、読み出せなくなってしまったデータのプリントアウト(5インチのフロッピーディスクとか)などである。

もっとも実用的なのは“ハイブリッド”タイプ

画像データでは文字列を対象に検索できないから、大量に溜めた時に探すのが大変、ときとして紙以上に面倒になる。かといってOCRに手間は掛けたくない…というので、たいがいの場合は“画像データに検索用のキーワードを付加する”というハイブリッド的手法が取られることになる。昔のOAの時代からある、光磁気ディスクを使った高価な“電子式ファイリングシステム”に始まり、現在の複合コピー機を使うタイプまで、このタイプが主流だ。
しかし、個人やSOHOでは気軽にこの手のシステム(最低でも100万円以上)を導入するわけにもいかない。というので、いくつか手の届くデバイス候補を挙げておく。

1. フラットベッドスキャナ+管理ソフト

僕が使っているのは、最近では1万円以下で買えるフラットベッドスキャナとPaperPort(ペーパーポート)という画像管理ソフトの組み合わせである。フラットベッドは場所を取るのが難点だが、ハンドスキャナは手で動かすために、ゆがまないように神経を使うので嫌いなのだ。
以前は手差しで読みとってくれる“シートフィードスキャナ”と呼ばれるタイプのコンパクトなスキャナがあって僕も使っていたのだけど、あんまり売れなかったようで、今では日本での取り扱いはされてないようだ。どうしても欲しいという場合は個人輸入という手もあるけど。

一方、画像管理ソフトはスキャナよりも高価なのだが、スキャナによってはバンドル版ソフトがついてくる機種もあるし、これで試してみて使えそうなら製品版にアップグレードする方法もある。

でも、やっぱりシートフィードスキャナがいいな……という人(僕のことだが)のためにはこんな製品もある。紙の両面を同時に読みとれ、しかも複数枚を一度にセットできるそうなのだが、実際に使ってみたわけではないので、実用的に使えるかどうかはなんとも言えない。僕も買おうかどうしようか迷っているところ。

2.デジタルカメラ+画像管理ソフト

OCRすることが前提であれば選択肢はスキャナだけだが、そうでなければデジタルカメラでもいい。というか、とりあえず画像データを備忘録として残しておくならスキャナよりも便利だし、持ち歩くことを考えればこれしかない。いくら小型でもスキャナだとPCに接続しなくては使えないが、デジカメなら単体で使えるからだ。
デジカメをスキャナ代わりに使うといっても高画質のものである必要はない。試してみたのだけど、150万画素でもA4の雑誌見開きを全部入るように撮影して、本文はちゃんと読める。写真の説明などの小さな文字は少々厳しいけど。喫茶店で新聞を読んでいてちょっとスクラップしたいとか、ミーティングしたときの相手のメモをコピーさせてもらうとか、画像メモとしての応用範囲は広い。

というわけで、今週は少々オタクっぽい話になってしまった。というか我ながらなんでこんなこと考えてるんだろうという気もしないではないのだが、仕事場の大半を占拠している紙の山を見ると、なんとかしないと…と思うのだ。しかし、「紙データをデジタルデータにするにはどんな方法があるか」という原稿を書いている人間の仕事場が、なぜ紙の山になっているのか、という疑問は…残りますね。


[2001年07月19日]