辞書の圧縮 〜EBShrinkの使い方〜

EPWINGや電子ブックの辞書は、CD-ROMで提供される比較的大容量のデータです。 容量の限られたコンパクトフラッシュやSDカードで多くの辞書を活用するには、辞書の圧縮が有効です。
EBShrink ユーティリティは、ebzip形式での辞書の圧縮・伸長を行います。
ebzip形式とはEBライブラリで使用されている圧縮形式であり、ebzip形式に対応した各種EPWINGビューアで共通に使用できます。 → ( http://www.sra.co.jp/people/m-kasahr/eb/ )

EBShrinkの機能

EBShrinkの起動

EBShrinkで辞書を圧縮する

  1. エクスプローラで、CD-ROM(または圧縮したい辞書データ)を EBShrink にドラッグ&ドロップします。
    ※ 圧縮したい辞書データを、個別に追加することもできます。
    ※ CATALOG(S)をドロップした場合、CATALOG(S)に記録された辞書データが全て追加されます。
  2. [Output Path]に出力先ディレクトリを指定してください。
    ※出力先を指定しない場合、入力ファイルと同じ場所に圧縮ファイルを作成します。
  3. 圧縮レベルを選択します。
  4. CD-ROMの辞書データを圧縮する場合、[copy directory tree]がチェックされていることを確認してください。
  5. [Shrink]を実行します。

オプション
[zip level] 圧縮レベルを0〜5の間で選択します。
数字が大きい(圧縮率が高い)ほど、ファイルサイズが小さくなりますが、辞書のアクセスは低速になります。
数字が小さい(圧縮率が低い)ほど、辞書のアクセスが高速になりますが、ファイルサイズは大きくなります。
[Output Path] 圧縮・伸長の出力先ディレクトリを指定します。 [Output Path]を指定しない場合は、オリジナルの辞書の存在するディレクトリに圧縮または伸長データを出力します。
[copy directory tree] 入力のディレクトリ構造を出力先に複写します。 このオプションは[Output Path]が指定されているときのみ意味を持ちます。 CD-ROMから複写する場合は、原則指定してください。
[keep original file] オリジナルの辞書を削除せずに保存します。 このオプションをチェックしない場合は、処理完了後にオリジナルの辞書は削除されます。
[Speed up index access] 圧縮辞書のインデックスのアクセスを高速化します。
各インデックスの上位2階層までの上位インデックスを非圧縮にします。書籍管理情報ブロック(書籍の第1ブロック)と複合検索管理情報(書籍構成要素識別子=0xFF)も非圧縮になります。 若干の容量増加(1%以下)と引き替えに、検索速度の向上が期待できます。

[Shrink] 辞書をebzip形式で圧縮します。圧縮後のファイルの拡張子は .ebz です。
EPWING圧縮、S-EBXA圧縮、LogoVista電子辞典の場合、自動的に伸張され、ebzip形式で再圧縮します。 LogoVista電子辞典の場合、出力ファイルは HONMON.ebz になります。
次のファイルは圧縮を行いません。[Output Path]が指定されている場合、[Output Path]にコピーされます。
  1. 2048バイト以下のファイル
  2. EPWINGの動画ファイル(MOVIE\の下のファイル)
[Expand] 圧縮形式の辞書を伸長します。伸張後のファイルの拡張子は .org です。
ebzip形式、EPWING圧縮、S-EBXA圧縮、LogoVista電子辞典は自動的に判別され、適切に伸長されます。 非圧縮のデータは、[Output Path]が指定されている場合、[Output Path]にコピーされます。
[CRC Check] ebzip形式辞書のチェックサムを検査します。ebzip形式以外のデータはスキップされます。

結果説明
Success ! CRCチェックに成功しました。
Failure ! ebzipヘッダに記録されたCRC値と、ファイルから計算したCRC値が一致しません。
データが破損している可能性があるため、原本から圧縮をやり直してください。

[Add] 書籍リストにファイルを追加します。※ドラッグ&ドロップと同じです。
[Delete] 書籍リストから選択したファイルを削除します。
[Clear] 書籍リストをクリアします。

EBShrinkで圧縮辞書を伸長する

EBShrinkでebzip形式辞書を検査する

圧縮レベルについて

ebzip形式では、圧縮レベル0〜5を選択できます。
一般には、数字が大きい(圧縮率が高い)ほど、ファイルサイズが小さくなりますが、辞書のアクセスは低速になります。 反対に数字が小さい(圧縮率が低い)ほど、辞書のアクセスが高速になりますが、ファイルサイズは大きくなります。

以下はEPWING版『漢字源』を圧縮レベルを変えて圧縮した例です。 図から分かるように、圧縮レベルを上げてもある程度で圧縮率は頭打ちになるため、 非力なPDAでは、圧縮レベルは0〜3が適当と思われます。

圧縮方法 サイズ圧縮率
original(『漢字源』) 50,538,496 100%
EPWING V6 28,875,265 57.14%
ebzip 0 18,158,641 35.93%
ebzip 1 16,945,216 33.53%
ebzip 2 16,102,975 31.86%
ebzip 3 15,501,217 30.67%
ebzip 4 15,046,893 29.77%
ebzip 5 14,712,251 29.11%

なお、圧縮率はコンテンツの内容によって大きく変化します。テキストデータのみの場合は30%前後まで圧縮できますが、 音声や画像のようなバイナリデータでは、圧縮率はそれほど期待できません。


Go to Home