html ファイルを org ファイル形式に変換する方法メモ

    はじめに

    学生のときに Yahoo geocities で作成した html によるサイトを Futurismo Wiki に移行したい.

    なぜなら, Yahoo geocities は, いつサービスが停止してもおかしくない気がするからだ.(人気的に) 昔の思い出は失いたくない.

    • 移行元サイトは完全な html 形式のファイル群
    • 移行先 wiki は org 形式でデータを管理している

    ということで, html から org へ変換する方法を調べた.

    Pandoc が利用できそう

    以前, pandoc を利用して, markdown を org-mode へ変換することをやった.

    今回もこの pandoc を利用して変換しよう. 導入方法は過去記事参照.

    htlm を org 形式に変換するコマンド

    $ pandoc index.html -f html -t org -o index.org

    文字コードを Shift-Jis から UTF-8 へ変換

    pandoc は UTF-8 形式しか受け付けないので注意. 変換には nkf を利用するとよい.

    $ nkf -w index.html | pandoc ....

    サイトを移行

    FTP で接続してサイト取得.

    とりあえずローカルに落として git 管理配下におく. 非公開で bitbucket へ upload.

    これで若き青春の日々の日記はクラウド上で永遠の生命を得た.