本文へスキップ

テクノロジ系 / アルゴリズムとプログラミング

文章間類似度

文章間類似度は、二つの文章がどれだけ似ているかを数値で表したものです。

もう少し詳しく

文章間類似度は、2つの文章がどれだけ似ているかを数値で表したものです。共通する単語、n-gram、ベクトル表現などを用いて計算し、検索結果の順位付け、重複文書検出、FAQ候補の提示などに使われます。

試験での見方

黒猫の闇の刻印

「文章同士の近さを数値化する指標」と押さえます。完全一致だけでなく、似た意味や似た単語構成を評価する点が特徴です。

例:「パスワードを忘れた」と「ログイン用の暗証を忘れた」は、単語が完全一致しなくても類似度が高いと判定されることがあります。

分類

テクノロジ系 / 基礎理論 / アルゴリズムとプログラミング

小分類:アルゴリズム

関連トピック:自然言語処理のアルゴリズム

情報の根拠

IPA FEシラバス Ver.9.2 の用語例をもとに、試験対策向けに独自解説しています。

関連用語

アルゴリズムとプログラミングの用語一覧へ