さて、つい先日 livedoor blog 無料版から移行してきたのですが、そのときの手順を自分用にメモ。
ざっくりと解説すると、
- 個別記事のテンプレートを変更して MT バックアップ形式に変換
- GetHTMLWで記事をすべて取得
- TextFileBinderで取得した記事をまとめる
- 秀丸エディタ等の正規表現で置換できるエディタを駆使して、取得したファイルを修正
- 完成
ってな感じです。
この辺は、こちらを参考にさせていただきました。
では、詳細を解説
個別記事のテンプレートを変更して MT バックアップ形式に変換
まずは管理メニューの「日付の表示形式」を日本語に変更する。
その後、個別記事のテンプレートを以下のように変更。
TITLE: <$ArticleTitle ESCAPE$>
AUTHOR: <$ArticleAuthor$>
STATUS: Publish
ALLOW COMMENTS: 1
ALLOW PINGS: 1
CONVERT BREAKS: 0
CATEGORY: <$ArticleCategory1$><ifarticlecategory2>CATEGORY: <$ArticleCategory2$></ifarticlecategory2>
DATE: <$ArticleDate$> <$ArticleTime$>:00
-----
BODY:
<$ArticleBody$>
-----
EXTENDED BODY:
<$ArticleBodyMore$>
-----
EXCERPT:
-----<commentsloop>COMMENT:
AUTHOR: <$CommentAuthor ESCAPE$>
EMAIL: <$CommentEmail ESCAPE$>
URL: <$CommentUrl$>
DATE: <$CommentDateTime$>:00
<$CommentBody$>
-----</commentsloop><trackbacksloop>PING:
TITLE: <$PingTitle ESCAPE$>
URL: <$PingBlogUrl$>
IP: 127.0.0.1
BLOG NAME: <$PingBlogName ESCAPE$>
DATE: <$PingDateTime$>:00
<$PingExcerpt ESCAPE$>
-----</trackbacksloop>
--------
※最後の '——–' の後には必ず改行を入れる
以上が終わったら、全記事を再構築する。
GetHTMLW で記事をすべて取得
続いて、GetHTMLW などの Web ページダウンロードソフトを使って、すべての記事をダウンロード。
取得が終わったら、個別記事のテンプレートを元に戻して全記事を再構築し直しておきましょう。
TextFileBinder で取得した記事をまとめる
次に個別記事をまとめてひとつのテキストファイルを作成。
livedoor の個別記事は blog.livedoor.jp\USERID\archives フォルダの中にある「数字.html」。
※例えば blog.livedoor.jp\dogmatism_and_prejudice\archives\50378535.html
TextFileBinder を使って、これらのファイルをすべてまとめて一つのテキストファイルを作る。
正規表現で置換できるエディタを駆使して、取得したファイルを修正
できあがったテキストファイルの日付形式が日本語形式(2007年05月10日)になっているので、秀丸エディタ等の正規表現を使用して置換できるエディタを駆使して日付形式を変換する。
置換前
^DATE: ([0-9]{2,4})年([0-9]{1,2})月([0-9]{1,2})日$
置換後
DATE: $2/$3/$1
livedoor blog では、文字コードとして EUC-JP を採用しているので、移行先に合わせて文字コードを変換しておく。
完成
と言うわけで、本日は MT形式でのバックアップまででした。
WordPress では、MTバックアップ形式のファイルのインポートもサポートしているので、このファイルを使って記事をインポートしてあげましょう。
以降は、また後日。