漫画の整理 ― 2007年04月15日
コミックダッシュに登録し始めたことで、蔵書がどの程度あるのか気になってきた。そこで部屋にある本を調べてみました。
まずは、本の山を崩しつつ、バーコードスキャナと Linux Zaurus (SL-C3000)を使って、本の裏表紙にあるバーコードをスキャンしていきます。バーコードは2段になっているけど、その上の段をスキャンします。このバーコードはJANコードですが、このJANコードから本の識別子であるISBNは導出できます。使うアプリケーションは単なるメモ帳でOK。
その際、バーコードの無い本はよりわけて、一つの山にしておきます。バーコードの無いのは、限定版や特装版など、バーコードが本を包むビニールなどに別になっているもの、わりと古いためにISBNが存在しないもの、ちょっと古いためにISBNはあるけどバーコードは存在しないもの、といったものがあります。これはあとでまとめて処理します。
バーコードをスキャンしてできたISBNのリスト(正確にはJANコードのリスト)を、Perlの Business::ISBNモジュールにある ean_to_isbn() メソッドで、一括して10桁のISBNに変換します。今年になってからISBNは 13桁になりましたが、とりあえず。
次に、コミックダッシュの全所有コミックリストのページの HTML を wget で取得し、適当な自作パーサで、ASIN のリストに変換します。
そして、スキャンして作ったISBN(10桁)のリストと、ASINの差分を作り、まだコミックダッシュに登録してない本のISBNのリストを作り出します。
この「まだ登録してないISBNリスト」を、Alexandriaにインポートし、本のタイトル等の一覧に変換します。
で、「まだ登録してない本のタイトル一覧」を見つつ、ひたすらコミックダッシュに登録していきます。
以上を何度か繰り返したあとは、バーコードの無いコミックのISBNをひたすら手で入力していき、同様に処理します。その後は作品名を直接入力していき、所有コミックのかなりの割合は登録できました。結果、1185シリーズ、2274冊が登録されました。ただ、
- Amazon に登録されてない本 (例: 苺タイムス)
- 著者名が Amazon に登録されてないので、コミックダッシュに登録できない本 (例: ヴァンデミエールの翼 (1))
などなど、おおよそ170冊ほどが登録できませんでした。さらに今回の発掘調査では発見できなかった蔵書もあるはずです。
最近のコメント