テクノロジ系 / アルゴリズムとプログラミング
文章間類似度
文章間類似度は、二つの文章がどれだけ似ているかを数値で表したものです。
もう少し詳しく
文章間類似度は、2つの文章がどれだけ似ているかを数値で表したものです。共通する単語、n-gram、ベクトル表現などを用いて計算し、検索結果の順位付け、重複文書検出、FAQ候補の提示などに使われます。
試験での見方
例:「パスワードを忘れた」と「ログイン用の暗証を忘れた」は、単語が完全一致しなくても類似度が高いと判定されることがあります。
テクノロジ系 / アルゴリズムとプログラミング
文章間類似度は、二つの文章がどれだけ似ているかを数値で表したものです。
文章間類似度は、2つの文章がどれだけ似ているかを数値で表したものです。共通する単語、n-gram、ベクトル表現などを用いて計算し、検索結果の順位付け、重複文書検出、FAQ候補の提示などに使われます。
例:「パスワードを忘れた」と「ログイン用の暗証を忘れた」は、単語が完全一致しなくても類似度が高いと判定されることがあります。
「文章同士の近さを数値化する指標」と押さえます。完全一致だけでなく、似た意味や似た単語構成を評価する点が特徴です。