本文へスキップ

テクノロジ系 / アルゴリズムとプログラミング

n-gram

n-gramは、文章を連続するn個の単位(文字や単語)に区切って扱う手法です。

もう少し詳しく

n-gramは、文章や文字列を連続するn個の単位に分割して扱う方法です。文字2個なら2-gram、単語3個なら3-gramのように呼びます。検索、文章類似度計算、入力補完、自然言語処理の特徴量作成などに使われます。

試験での見方

黒猫の闇の刻印

「連続するn個の文字や単語に区切る方法」と押さえます。意味を直接理解する処理ではなく、機械的に特徴を取り出す方法です。

例:「情報処理」を文字2-gramにすると、「情報」「報処」「処理」のように分割できます。

分類

テクノロジ系 / 基礎理論 / アルゴリズムとプログラミング

小分類:アルゴリズム

関連トピック:自然言語処理のアルゴリズム

情報の根拠

IPA FEシラバス Ver.9.2 の用語例をもとに、試験対策向けに独自解説しています。

関連用語

アルゴリズムとプログラミングの用語一覧へ