本の自炊のデータ管理について、私なりのやり方

Hobby
2019年08月28日 10:00

概要

私は、本の自炊を行なって、紙の本をデジタルデータとして保存して残しています。

ここでは、私がどのような方法を使って自炊してできたデータを管理しているのかを紹介します。

自炊について

自炊とは、スキャナ等を使って紙の本をデジタルデータに変換することです。
デジタルデータに変換する時に、スキャナにもよりますが本を破壊します。

私は、ScanSnap iX1500というスキャナを使っています。
自炊をする上では、メジャーなスキャナに位置するものです。

裁断について

本をスキャナにかける際には、紙の本を裁断してスキャナにかけることができる形にします。

これは、裁断機などを使う方法もありますが、300ページくらいの本を一発で裁断するような裁断気になると数万円をするため、カッターを使って裁断しています。

スキャンについて

ここから、私が特に説明したいと思っている部分になります。

スキャンの際には、カラーかグレースケールでスキャンします。さらに、最高画質(ScanSnapで言うところのエクセレント)で保存します。またファイルはPDFで保存します。
カラーかグレースケールで保存するのは、なるべく元の本の情報に近い形で保存するためです。
最高画質で保存するのは、スキャンした紙の本は捨てるので、なるべく正確な状態で保存するためです。
PDFで保存する理由は、扱いやすいからです。

最高画質での保存の欠点として、ファイルの容量が大きくなるということがあります。
ファイル容量が大きくなることは、ある程度許容しているのですが実際にタブレット等で見るのには適しません。
そこで、普段使うものは圧縮をして容量を小さくしています。

保存について

スキャンしたデータはクラウド等の信頼できる場所に保存しておきます。
信頼できるというのは、絶対にファイルをなくさないということです。

なぜファイルをなくさないようにするのかというと、後述する圧縮したファイルはなくしてもいいのですが元データはなくしたらどうすることもできないので、絶対になくさないようにします。

圧縮について

実際にスキャンしたデータを見るとなった際に元データではサイズが大きくて、取り扱いが難しいです。
そこで、ファイルを圧縮してファイルサイズを小さくしています。

私は、圧縮のソフトとして、Nuance Power PDFを使用しています。
Nuance Power PDFは、ScanSnapに標準でついてくるPDFの編集ソフトです。
通常は有料なのですがScanSnapを購入した場合ライセンスが1個ついてくるため、Nuance Power PDFを使用しています。

Nuance Power PDFでは、圧縮をしているのですが、圧縮にはMRCという方法を採用しています。

実際に圧縮をすると本の内容にもよりますが、900MBくらいのファイルが15MBくらいになりました。
ちなみに圧縮したのは技術書です。

私はこの圧縮したファイルをEvernoteに保存しています。

さいごに

このような形に落ち着くまで結構時間がかかりました。

個人的に、元データと実際に使うデータを分けたのがいいのではと思っています。
分けておくことで、もしファイルに不具合があっても高画質なデータが残っているので、それを元にまた作り直すことができます。