【英語】 TF-IDF: Term Frequency - Inverse Document Frequency

【読み】 ティーエフアイディーエフ

用語解説

文書内に出現する単語について、以下の2つの情報からその単語の重要度を算出する手法
 ・単語の出現頻度(TF値)
 ・単語の逆文書頻度(IDF値)
TF(Term Frequency)値は文書内でのある単語の出現頻度。すなわち、文書内のすべての単語の出現回数のうち、その単語の出現回数が占める割合を表す。出現回数が多いほどTF値は大きくなり、出現回数が低いほどTF値は小さくなる。
IDF(Inverse Document Frequency)値は、文書集合の中のある単語が含まれる文書の割合の逆数を表す。単語が他の文章にも多く出現しているほどIDF値は小さくなり、単語が他の文章にあまり出現していないほどIDF値は大きくなる。
TF-IDF値はTF値とIDF値をかけ合わせて計算する。

関連キーワード

関連事例


運営会社へのお問い合わせは、下記ボタンよりお問い合わせください。

運営会社へのお問い合わせはこちら 

bodais

bodais

DX総合支援サイト

運営会社