Namazu for WINをWordが導入済みの環境にインストールすると、一太郎のjtdファイルはNamazuの検索対象になります。Wordの文書コンバータ機能を使って、Wordにjtdファイルを読み込ませ、インデックス化のためのtextファイルを抽出しています。Wordに一太郎の文書コンバータがインストールされているかどうかは、Wordを起動した状態で「ファイルを開く」から一太郎ファイル(jtd)を指定して開いてみれば分かります。「未対応」と言われたら、WordのインストールCDを用意してインストールしましょう。一応、これで一太郎ファイルは検索できるようになるのですが、Wordを入手してPCにインストールする必要があり、一太郎ユーザとしては、そんなムダなことはしたくないし、ハードディスクも圧迫します。 そこで、vetextという一太郎ファイルからtextを書き出せる国産のツールを使った方法を紹介します。vetextはPDFやWord、Excelにも対応しているため、個人的にはPDFのtext抽出にもこちらを使っていたのですが、pdftotextが機能アップして問題がなくなったようなので、PDFについては省略します。 vetextは日本障害者リハビリテーション協会が障害者情報ネットワーク「ノーマネット」で提供しているALTAIR (アルティア)というアプリケーションに含まれています。ALTAIRは「日本語MS-DOSで動作し、画面に文字情報のみを表示するブラウザおよびメーラーです。音声出力、点字出力にも対応しています。画面上の画像を見ることができない視覚障害者を含む人々が、文字情報を介してインターネットを利用することができます」と紹介されています。商業目的での頒布は禁止されていますが、個人などはフリーで利用できます。最新バージョンは4.79です。 詳細はhttp://www.normanet.ne.jp/~software/al_wmail.htmを参照してください。 入手先 ftp://ftp.jsrpd.jp/pub/altair/dos/al479d.exe ダウンロードした自己解凍形式のal479d.exeを実行し、アーカイブを展開します。なお、ALTAIRはNT系OSは公式にはサポートしていませんが、NT4.0workstation(SP6a)ではvetextの動作は問題ないようでした。自己責任でインストールしてください。展開したディレクトリの中にあるSETUPDMC.EXEをダブルクリックしてインストールします。ディレクトリの中にあるVETEXT.EXEをC:\namazu\binにコピーします。 C:\namazu\share\namazu\filterにあるtaro.plをテキストエディタで開き、 次の行を変更します。 43行目付近にある
を
に変更します。 次に79行目付近の
を
に変更するとともに、次の行に
を追加します。 taro.plは本来、UNIX系OSでjtdファイルからtextを抽出するdoccatというアプリケーション用のフィルタですが、上のように変更することでvetextを利用できるようになります。 これでWordがなくても、一太郎ファイルが検索できるようになるはずです。 Namazu-win32-users-jaのメーリングリストでは一太郎を直接、呼び出してインデックスを生成するPerlとRubyによるfilterも紹介されています。個人的には試みていませんが、関心があればMLの過去ログのhttp://www.namazu.org/ml/namazu-win32-users-ja/msg01053.htmlあたりを参照してください。 これに加え、Perl+Rubyによるフィルタ作者の小嶋@青森さんが、一太郎がインストールされた環境でPerl単独で一太郎ファイルをインデックス化できるフィルタを作成し、Namazu-win32-users-jaのMLにポスト(2002/03/07)されました。動作確認してみたところ、問題なく動くようなので、下で紹介します。vetextによる処理はインデックスに若干「ごみ」が混じるので、一太郎をインストールしている環境であれば、こちらの方法が望ましいかもしれません。
上で紹介したPerl単独の一太郎フィルタjt.plの導入方法を説明します。なお、jt.plはまだ、開発途上です。小嶋さん自身も思わぬ不具合が出る可能性があると指摘されています。自己責任でインストールしてください。個人的に試した環境(Windows XP Home Edition、Windows98、いずれも一太郎12)では特に問題なく動作しています。一太郎11フィルタということになっていますが、一太郎12にも対応しており、動作を確認しました。 Namazu-win32-users-jaのメーリングリストの過去ログにjt.plのfix版があります。 入手先 http://www.namazu.org/ml/namazu-win32-users-ja/msg01306.html htmlファイルのうち -----------------------------<jt.pl>------------------------------ の次の行の#から最後の1;までをコピーし、テキストエディタにペーストして、文字コードEUCでjt.plとファイル名を付けて保存します。 jt.plをC:\namazu\share\namazu\filter\win32ディレクトリにコピーします。同ディレクトリにoletaro.pl(Wordを使って一太郎ファイルをインデックス化するフィルタ)があれば削除します。oletaro.pl.tmpは残しておきます。必要になったときにtmpを外せば、oletaro.plを復活できます。 上で紹介したvetextをインストールしてある場合はC:\namazu\binに置いたvetext.exeも削除します。 これでjt.plフィルタを使って一太郎文書がインデックス化できるようになります。 jt.plをアーカイブしておいておきます。LHA(lzh)形式で圧縮してあります。展開(解凍)して使ってください。なお、これは初期のバージョンですので、下で紹介している小嶋さんのHPから新しいバージョンを入手するのが望ましいです。 入手先 http://www.actv.ne.jp/~kkojima/jxwlog.html なぜか、小嶋さんがサイトで公開しているjt.plの最新版へのリンクが切れてしまっていますね(^^;) 小嶋さんがNamazu-win-usersに投稿されたものを元につくったjt.plをこちらに置いておきます。リンク切れ直りましたね(^^)/ |
||||||||||||||||
|
|
| TOPに戻る | miyazawat@hotmail.com |