ポケットに広辞苑を

僕は電子ブック野郎なのでDDwinを常用していますが、Windows用の辞書ソフトでは「PDIC for Windows」も有名です。基本的には外国語の辞書向けですが、バージョン4からはEPWING/EBにも限定的ながら対応したため、常用こそしていないもののインストールしていろいろ試したりしています。

最近、そのPDICのWindows CE版(α版)がリリースされました。実は前々から、PalmSize-PC(PsPC)マシン、CASSIOPEIA E-55に広辞苑を入れて、「ポケット広辞苑」を実現したいなぁ、と思っていたのですが、もちろんDDwinのWindows CE版なんて出てないし、ただのテキストデータでは検索性が皆無だし……ということで頓挫していたのです。そこに来てPDIC for PsPCのリリースということで、こいつをうまく使えばポケット広辞苑が実現するのではないか、とチャレンジしてみました。

はじめに:用意するもの

なんか最後の二つあたりが普通持ってないよ〜って感じですが(特にフラッシュメモリ。僕は96MBだけど)。まあ、「DDwinを利用して電子ブック辞書をテキストに落とす」という技だけでもそこそこ便利かもしれないので、よかったら参考にしてみてください。

EPWING版広辞苑→テキストファイル

まずは、独自形式のデータであるEPWING版の広辞苑を、テキストに落とします。手順は以下のとおりです。

  1. DDwinで「広辞苑 第四版」を開く
  2. 「ツール」-「総合検索」で総合検索ダイアログを表示し、「全文検索」を指定、「検索条件」には何も入力せず、「検索」ボタンを押す。しばらく(2〜3分)で、全文検索が行なわれる
  3. 「編集」-「エディタ起動」で、「該当項目すべて」を出力する。4〜5分くらいで出力が行なわれ、「ワードパットで開きますか」といったメッセージが出るがここは「いいえ」(任意のエディタを指定してる場合はそのエディタで開かれるが、とりあえず閉じる)

これで、広辞苑がテキスト化されました。なお、普通にテキスト化しただけでは、外字が変換されません。変換するには「辞書個別設定」で、外字の変換テーブルを指定する必要があります。不完全ものですが作ってみたので参考にしてみてください。
koujien4.gjt(10.9KB)
DDwinと同じフォルダに置き、広辞苑の辞書個別設定で「Include=koujien4.gjt」という風に指定すると読み込まれます(本番前に短い項目を出力してみてテストするとよいでしょう)。

テキストファイル→1行テキスト形式テキストファイル

テキストファイルを、PDIC辞書に変換することができる特殊な形式「1行テキスト形式」にコンバートします。えー、例によってここはWZマクロの出番です。以前「日本大百科全書」の件などでお世話になった太田純さんに「テキスト処理なら」ということでperlを勧められ、分厚い参考書を買ってきたものの結局手を付けておりません。やっぱWZの方が楽なんだもんなぁ、表テキストで処理すれば経過が逐一分かるからデバッグ楽だし……っと、話がそれました。以下のマクロをダウンロードして使ってください。使い方は中に書いてあります(いいかげんだけど)。WZ使いじゃなくても、どういう処理をする必要があるか、という参考にはなるかもしれません。
KJENtoPDIC.txc(4.70KB)

2001/07/21追記:現在は僕自身はこのマクロを使っていません。いくつか不都合が起きているという報告もいただいていますが、こちらで対応する予定はありません。

に、それぞれの執筆者の方が作成したPerlスクリプトやマクロがありますので、こちらを使ってみるのもよいかと思います(僕自身は使ったことはありませんし、内容を保証するものではありませんが)。

1行テキスト形式テキストファイル→PDIC辞書ファイル

ここまで来たら、あとは簡単です。PDIC for Windowsを使って1行テキスト形式ファイルを辞書にコンバートしましょう。やり方はPDICWのヘルプにあるので割愛しますが、ポイントは

って所でしょうか。

ちなみにコンバートすると33個ほど欠損単語が出ます。恐らくPDIC辞書の日本語訳部分の文字数制限を超えてしまったからだと思いますが……。とりあえず今は捨てちゃってますが、うまく処理できるかちょっと調べてみよっと。

PDIC辞書ファイル→PDIC for Windows CE辞書ファイル

このへんも、PDIC for Windows CEの説明のとおりにやれば、特に難しいことはないです。設定などにもよると思いますが、できた辞書はだいたい40〜50MBになります。

まとめ

という感じで作成した辞書をコンパクトフラッシュにコピーし、CASSIOPEIA E-55上のPDIC for Windows CEで使っています。さすがに40MB以上の辞書ということで起動には結構な時間がかかりますが、起動さえすれば、さすがPDIC、インクリメンタルサーチでさくさく辞書が引けます。
インデックスの構造などの関係上、ひらがなによる検索しかできないのがちょっと残念ですが、それでも200g程度のPDAで広辞苑が引けるというのはなかなか便利です。寝床や電車の中での読書などに重宝しています(^^)。

Copyright©1998-2005 Yujiro Nakamura All rights reserved.
本サイトに関するご連絡の方法はreadmeをご参照ください。

本Webページの無断引用、本Webページへの無断リンクを歓迎します(笑)。