関連記事」タグアーカイブ

WordPress Related Post for Japanese で全文検索を行う

hiromasaさんが作成したWordPress用の関連投稿表示プラグインWordPress Related Post for Japanese(wp-jrelated)を利用して、各記事に過去記事から関連する記事を自動で表示しています。

この wp-jrelated が関連記事を検索する仕組みですが、おおよそ以下のとおりです。

  • Yahoo! 日本語形態素解析でコンテンツを解析し、名詞を抽出
  • 抽出された名詞を頻出順でカンマ区切りでDBに格納
  • 抽出された名詞の中から頻出する名詞トップn個を抜き出し、それを使って過去記事を like 検索
  • 関連度合いは、元記事の頻出単語が幾つ関連記事に含まれるかを計算
    その際、上位頻出単語の方が重みを持つようにランク付け
    ※このランク付け方法が中々良くできてます、ソースを読むことをオススメ

これだけで、かなりの精度を出せているので大したモノです。
しかし、単語のMD5ハッシュを取ってデータを格納しているため「WordPress」と「wordpress」、「ついった」と「ツイッタ」を別単語として扱ってしまいます。
また、今は大丈夫ですが、単語を like の or で検索しているため記事数が膨大になった時のパフォーマンスも気になります。

てなわけで、MySQL の全文検索機能を使って、さらに精度アップ&検索速度アップを狙ってみました。
続きを読む

WordPress Related Post from Referer

検索エンジン経由で来訪した人に対して、WordPress Related Post for Japanese の作成する形態素解析情報を利用して関連記事を表示するプラグインWordPress Related Post from Refererをリリースしました。
ダウンロード・使用方法等は、WordPress Plugins/JSeries » WordPress Related Post from Referer を参照してください。

わざわざ検索エンジン経由で見にきてくれた人は、ひょっとすると検索キーワードに関連する別の記事も見たいのでは無いか?
ならば、それもリストアップしてみよう!と言う感じのコンセプトです。
「MT4で簡易的なLPO対策を実現するモジュール」と言うエントリにインスパイヤされて作成しました。
関連記事の取得方法は、hiromasaさんの WordPress Related Post for Japanese を丸パクリしています。

とりあえず、どんな感じになるかは、以下の Google 検索結果で表示される上から2件目のリンク経由で、このサイトにきてみてください。
quick comments – Google 検索
冒頭に関連記事が表示されるはず。

とりあえず機能には満足しているので、私にしては珍しく Ver.1.0.0 でリリースします。
これ以降の機能アップとかはしない予定。

WordPress Related Post for Japanese 導入

Yahoo! Japan が提供する日本語形態素解析APIを利用して、WordPress の投稿をアナライズし、自動的に「関連する記事」へのリンクを作成するプラグイン WordPress Related Post for Japanese を導入しました。
関連記事は、今までは SimpleTags プラグインを利用していたのですが、今度からはこちらに切り替え。

とりあえず、試験的に導入したこちら以外のブログでは、英文記事の引用が多いため "this,that,it,is,of,in,and,the" なんかのいわゆるストップワードが頻出単語上位に含まれるため、精度がイマイチ。
と言うわけで、簡単なストップワード対応をしてみました。
続きを読む