情報検索アルゴリズムを読んでいます。
サーチエンジンの心臓部を少し覗けた感じがします。
計算式がすごいんです。本当に計算をしているのというような感じです。感じというのは私が見てもまったく理解できるはずもなく暗号化されているかのようです。
ただ、文書もあるのでなんとなく理解できています。
どんな状態でサーチエンジンが順位を弾き出しているのか。例外はどんな場合かということが書かれています。
Googleは進化のスピードを止めることはないでしょう。それについていかなければならないのが私たちです。
前回も言いましたが、日本語の理解を進めています。
ここで質問です。ストップワードをご存じですか?
このストップワードは日本語を使う私たちにとってとても大切な役目を果たしています。
「飛行機が飛ぶ」この文章では3つの単語にわかれていますね。
飛行機、が、飛ぶ、この3つになります。
この中で無視しても差し支えない単語は「が」ですよね。文章としては「が」の意味は大切になる場合があるのですけど、検索対象から外す言葉がストップワードなのです。
検索を意識して、空白やスペースを無理に入れている文章を見かけることがあると思います。
私たち専門家からみると検索を意識しすぎているのだな~と思ってしまいます。
でも、一般の人がみるがタイトルをみるとヘンテコなタイトルだなと思ってしまいます。さらに、何か裏があるのではと勘ぐってしまってクリックしない場合もあります。
ストップワードを理解することで、ヘンテコなタイトルをつけなくてもよいということになります。代表的なストップワードは、の、を、が、などまだまだありますが、覚え時には単語と単語をつなげるときに使う言葉になります。1語~3語が多いです。
そして、ただし、つまりなどもストップワードになりえます。
ストップワードがわかれば、人間にもわかりやすい言葉で書けると思います。
無駄なスペースは排除するタイトルや記事を目指しましょう!