LSI (Latent Semantic Indexing)

LSI (Latent Semantic Indexing)とは、
直訳すると「潜在的な意味をインデックスする」といった意味で
高次元の空間にある単語文書行列を射影により小さな行列で
近似し検索精度の改善を図る技術です。

高次元ベクトル空間にある単語・文書を小さな行列で近似することで、
検索精度の向上を図る情報検索の技術です。
同義語や類義語をまとめて1つの概念として扱うことで、処理の精度を高めています。
Googleの特許のひとつで単語同士の関連性に着目して
コンテンツの内容を読み解くための検索技術となります。
最近では、Yahoo!でも独自のLSI技術を取り入れています。

LSI (Latent Semantic Indexing)は、
検索エンジンで使用しているアルゴリズムの向上により、
「旅行」など個々の単語でしか検索できなかったときから、
「旅行」「ホテル」「予約」などの意味不明な単語の羅列ではない、
より高いレベルでのキーワードとの関連性や、
意味が通じるコンテンツを探すことができるようになりました。

SEO WORD-011
検索サイト側でも、ウェブページの『個々のキーワード』だけで
探しているわけではなく、ページ「全体」の記事が何を伝えているのかを
重要視する傾向になりつつあります。
そのため、これからサイトやホームページを作成する場合は、
デザインだけではなく、関連語句も使いつつ、
スマートなデザインと魅力のある文章能力で、
サイトを展開していかなければならないでしょう。

タグ