堺風の頭部

徘徊、カメラ、PC、その他。

神皇正統記をSONY Readerで読むために行った処理

www.geocities.jp

祖父が北畠親房が好きだったらしく、私自身や家族にそういう形跡がちらほら見える。

そういう縁で、「神皇正統記」を読んでみようかと思ったのだけど、何度か書店の店頭で探した限りは見つからなかった。そして検索してみたら見つかったのが、上のサイトだった。

これは有り難いということで早速、電子ブックリーダーで読みやすいように整形してみた。

前提

整形

まず、一行目にタイトル、二行目に作者とする。

目次は機能させるのも面倒なので、削除していいかも。好みで。

ふりがなのルビ化

「世界の古典つまみ食い」では、ルビ・脚注などがすべて()括りで記載されている。

一部、全角()が半角になってしまっているものもあるので、先に全角に統一する。

青空文庫では、ルビは《》でくくることになっているので、一旦(を《に、)を》に単純置換する。

ルビを「」内に移す

「世界の古典つまみ食い」では、カギカッコ内の文字列のルビが、「日本」(ヤマト)という形で書かれている箇所がある。

しかし青空キンドルは、「日本」《ヤマト》ではルビと認識できないので、「日本《ヤマト》」と改める。

oeditの置換で以下のようにする。

検索文字列: 」(《[^》]*》)
置換後の文字列: \1」

注釈の処理

「世界の古典つまみ食い」では、欽明天皇の御代(=六世紀)といった形の注釈がある。

また垂迹(すいじやく=仏のなり代わりとしての神)といったルビと注釈が連続しているものもある。(先の手順で()は《》に置換済み)

まずルビ・注釈連続のものを切り離し、垂迹《すいじやく》《=仏のなり代わりとしての神》とする。

oeditの置換で以下のようにする。

検索文字列: 《([^=》]+)=([^》]+)
置換後の文字列: 《\1》《=\2

 

これでルビと注釈が分離された。

ここまでの処理で、「《》内に=を含むものは注釈」という形になっているので、注釈の《》を()に戻す。

検索文字列: 《([^》]*=[^》]*)》
置換後の文字列: (\1)

 見出し付け

細かく見出しをつけるのは手間だが、神皇正統記 巻一から巻六まで、それぞれは見出しとして、直前に改ページを入れておく。

これは無理に一括置換しなくても、「.*巻*$」で検索して[#改ページ]を直前に貼り付ける程度でいいのでは。

 

これくらいの処理をしたものを青空キンドルに流し込めば、まあまあ読みやすくなったものが得られる。