口語訳聖書のテクストファイル化

著作権が切れた口語訳聖書のEPWING版について、前に触れた(記事のリンク)。ザウルスの ZTEN 改で読めるようになったが、辞書ソフトを使っての閲覧にはちょっと抵抗があった。

そこで、すでに公開されている HTML ファイルを加工して、「文庫ビューア」で読めるようにしてみた。具体的には、66のファイルの HTML タグを消して、テキストの整形する。そこで使ったのはテキストエディタの xyzzy である。このソフトには、ディクレトリを再帰的に置換するコマンドがあるので*1、いちいちファイルを一つずつ修正しなくてもよいのである。文字コードの一括変換(EUC→Shift-Jis)には、Emacs/Meadow のファイラー dired を使った*2

で、完成したファイルをザウルスで表示したのが以下の画像。



振り仮名の処理はちょっと面倒なので今回は見送った。時間があったら、振り仮名付きのファイルを作ってみたい。

*1:ディレクトリの一括置換は xgresreg、正規表現による一括置換は re-xgresreg である。いずれも拡張 lisp なので注意。

*2:コマンドは dired-do-convert-coding-system である。詳しくはMeadow/Emacs memoを参照。