リエゾン検索の読み解き方:引用符のあるなし


日本語というのは、英語のような分かち書きをせずに、ズラズラと文字を並べるので、検索エンジンはページの中にあるどの文字からどの文字までが単語なのかを切り分けて保存し、そのデータを元に検索の処理を行います(細かい理屈は「形態素解析」とかで調べてみて下さい)。

たとえば「液晶テレビ」という言葉は、たいてい「液晶+テレビ」という2語で認識されて、このページは「液晶」でも「テレビ」でも検索されうるわけです。また、「テレビ液晶」という言葉でも引っかかる可能性がある。これを「液晶テレビ」という形でしか検索しないようにするのが引用符です。Googleでは「フレーズ検索」、Yahoo! JAPANでは「表記のゆれを含まない」検索、というような言い方をしていますが、要するに、検索したい文や句(複数の要素で構成された文字列)を半角のダブルクォーテーションで囲って「"液晶テレビ"」と入力すると、この形でしか結果を引っ張ってこないと、そういうことです。

で、これと日本語リエゾンにどんな関係があるのかというと、リエゾンネーミングを引用符で囲って検索することで、「検索エンジンがそのネーミングを1語として認識しているかどうか」、つまり「そのネーミングが検索エンジンに支持されているか」=「世間に認められたネーミングかどうか」がわかるわけです。

注目すべきは、検索の総ヒット数(表の中では分母)です。

たとえば2006.11.2の計測結果において、「シネマイレージ」は引用符のあるなしにかかわらず、Google、Yahoo! Jともに同じ分母です。つまりこれは、各検索エンジンが、「シネマイレージ」を一語として扱っているわけです。

一方、同じシネマ系である「イチオシネマ」は引用符のあるなしで分母の数が変わっています。引用符なしの検索結果(SERPs:Search Engine Results Pagesといいます)を見ると、「イチオシ」を一語として取って、「イチオシ+ネ+マ」としてSERPsを出していることがわかります。つまり「イチオシネマ」とは何の関係もないページでも、「マ、いろいろありますけどコレがイチオシなんですよネ」というような文章があればSERPsに入ってきてしまう。引用符ありなしの差が大きいほど、関係ないページが出てくる率が高くなります。

たとえばこの、「マ、いろいろありますけどコレがイチオシなんですよネ」という文章が書いてあるページが、パソコン通販の大手とかニュースサイトで、インターネットにおいて日テレよりも高いメディア価値が認められていたりすると、「イチオシネマ」で検索したときに日テレよりも高い位置に来る可能性があるわけです。

一般のネットユーザーがわざわざ引用符付きで検索してくれることは期待できませんから、ネーミングに関わった担当者はすべからくこの「引用符なしで検索した場合のSERPs」の結果を見て、プロモーションの至らないところを反省すべきです。

ちなみに2006.11.2の計測で分母が引用符に影響される状態になっているのは以下の通り。

  • 愛・地球博
  • イチオシネマ
  • エスティマインド
  • 縁結麦酒
  • こっそリフレッシュ
  • コミ結婚
  • しっとリッチ
  • セレぶくろ
  • チャリティッシュ
  • チャリTシャツ
  • ニコステキ
  • にゃんこたつ
  • バカップル
  • BIGLOBE
  • ビスコトバ
  • ピタゴラスイッチ
  • ひっぱりンクル
  • ブンカッキー
  • ホイップカスタードーナツ
  • まぐろーど
  • マヨナカフェ
  • みしまっぷ
  • ミライス
  • メリークリスマッスル
  • モスイート
  • リニもなか
  • るるぶっく
  • ローソング
  • わたCM
  • わんこたつ

表記として「カタカナ + 漢字」とか「ひらがな + カタカナ」というような異なる文字種の組み合わせになっているものは、2語以上に分割されて認識される可能性が高いようです。商用ネーミングで、カタカナのみ、ひらがなのみでこの状態になっているものは、ネットでのプレゼンスという意味でかなり弱いネーミングといえます。

一方、異なる文字種の組み合わせでありながら、分母が同数になっている

  • ごちソース
  • スパむすび
  • たのしメール
  • なかやまきんに君
  • 熱さまシート
  • わくわクマ

などは、ネットにおいて(ひいてはリアル世界でも、ということだと思うのですが)非常にいい位置にあるネーミングだと言えるでしょう。

こんなネタもどうぞ: