テクノロジ系 / アルゴリズムとプログラミング
n-gram
n-gramは、文章を連続するn個の単位(文字や単語)に区切って扱う手法です。
もう少し詳しく
n-gramは、文章や文字列を連続するn個の単位に分割して扱う方法です。文字2個なら2-gram、単語3個なら3-gramのように呼びます。検索、文章類似度計算、入力補完、自然言語処理の特徴量作成などに使われます。
試験での見方
例:「情報処理」を文字2-gramにすると、「情報」「報処」「処理」のように分割できます。
テクノロジ系 / アルゴリズムとプログラミング
n-gramは、文章を連続するn個の単位(文字や単語)に区切って扱う手法です。
n-gramは、文章や文字列を連続するn個の単位に分割して扱う方法です。文字2個なら2-gram、単語3個なら3-gramのように呼びます。検索、文章類似度計算、入力補完、自然言語処理の特徴量作成などに使われます。
例:「情報処理」を文字2-gramにすると、「情報」「報処」「処理」のように分割できます。
「連続するn個の文字や単語に区切る方法」と押さえます。意味を直接理解する処理ではなく、機械的に特徴を取り出す方法です。