N/A

紙のドキュメントをデジタルデータにする

今回のテーマは“ボールペンで紙に書いたメモを、どうデジタル化し共有するか?」だが、これは“ボールペンで紙に書いたメモ”に限った問題でもない。たとえば、プリントアウトされた紙資料、あるいは、新聞や雑誌のスクラップ、つまりは保管・蓄積を必要とする“紙に記された情報一般”についての話だ。
“紙”は使い慣れている分、非常に扱いやすい。なにしろデジタルデータとは違って、目に見えるし、触ることもできる。探すのも楽だ。その上電源なしで読むことができる。間違って破ってゴミ箱に捨てても何とか復活させられる、等々。とはいえ、量が増えてくると、そういった紙のメリットも失われていく。どこに何があるのか、わからない、探し出せないものは“ない”も同然、ということになる。
しかも、紙は複製するにも送るにもコストがかかる。多くの人に伝達する場合、大量にコピーすればコストがかかるし、一部だけにして回覧すれば時間がかかる。他人のところを回覧されている間は読むこともできないし、最悪、途中で紛失してしまうこともありうる。紛失しなくても僕のようにすぐ忘れてしまう人間だっている。

紙の文書では、保管と伝達はトレードオフの関係にあった

というわけで、“紙に記録された情報”というのは、“情報を共有する”という観点から考えると、これはこれで不便なものなのだ。きちんと保管しようとすれば多くの人に見せることは難しいし、多くの人に見せようとすれば紛失の危険があり保管が難しくなる。
グーテンベルグの印刷術が画期的だったのは、この紙の問題を“情報を複製するために紙を複製する”という、今から考えてみれば少々乱暴な方法で解決したからであり、現代のビジネスにとって必需品のコピーマシンも基本的には同じだ。必要な数だけをその場で複製できるというやり方は印刷に比べれば少しはスマートだが。
デジタルデータにしておけば…いまさら説明するまでもないが、物理的な実体がないから蓄積しても場所は取らないし、いくらでもコピーできる。ネットワークにおけば、紙とは比較にならないほどの低コストで多くの人に同時に読んでもらうこともできる。少々ハンドリングは面倒だが、デジタルデータには紙には逆立ちしても出来ないことが出来る。
というわけで、“紙に記録された情報をどうやってデジタルデータに変換するか”という本題である。

理想の“アナデジ・コンバータ(仮称)”

理想を言えば、“ごく普通に手書きで書かれたメモをシュレッダーに放り込む*2とシュレッダーに組み込まれたスキャナ*1が読みとり、文字はOCRされテキストデータとして*3、図は画像データとして*4ネットワーク上のデータベースに蓄積され、紙はゴミとして廃棄される*5、ということになるのだが、現時点ではもちろんまだ夢物語だ。が、とりあえず順番に見ていく。

    • 1.シュレッダーにスキャナを組み込むのは、“紙の上の情報だけがデータとして変換され、不要になったキャリアである紙は自動的に廃棄される”というイメージを表したかったからで、実際にはいったんごみ箱に入って、しばらく経ってから廃棄というフローになると思う。
    • 2.ただ、読みとり方法としてはシュレッダーのように“放り込む”という感覚がほしい。フラットベッドスキャナというのは場所も取るし、蓋を開けてゆがまないように注意しながらセットして蓋を閉めて…というのは、面倒だから。ADF(自動原稿送り機)付きならフラットベッドでもいいのだけど。
    • 3.手書き文字のOCRは昔ちょっと調べた限りでは、保険の申込用紙などごく一部でしか実用化されていない。PDAでそこそこの認識ができるのは筆順という重要な情報が使えるからで、書き終えた画像としての文字をOCRで認識するのはとても難しいだろう。でも不可能ではないはずだ。なにしろ1970年代には“絶対不可能だ”と考えられていた天気予報でさえ、かなりの精度で可能になったのだから。
    • 4.数行に渡る文字列を文字として認識させるのはそれほど難しくないだろうが、図の中に埋め込まれた文字、あるいは○や□で囲まれた文字を画像と分離して文字として認識させるのは結構面倒だろう。もちろん、いったん読み込ませて画面上で編集すればいい、という考え方もあるけど、そんな面倒なことを僕はしたくない。
    • 5.処理の終わったデジタルデータをデータベースに蓄積する…別にそこまでする必要ないんじゃないの? と言われるかもしれないが、そもそもでデジタルデータにするのは“蓄積して再利用するため”である。しかも大量のデータを。となればデータベースで管理できなければデジタルデータにする意味は半減してしまう。だからこれは必須なのだ。


こう見てくると、現時点でも運用次第ではそこそこ使えるデバイスがあることに気が付く。ものはついで、来週は実際にどんなものがあるのか、僕の知る限りご紹介することにしよう。


[2001年07月12日]