テキストマイニングのマイニングとは、テキストの山から価値ある情報を掘り出す、といった意味が込められています。
技術研究
特徴度は、文書(テキスト)の特徴を効率よく把握するための指標です。テキストの特徴は単語の出現頻度と大きく…
技術研究
一つの文書は文の集合体で構成されており、それぞれの文には、文書の主張を伝える上で重要な役割をもつものも…
技術研究
文章の構成単位は大きく、単語、文(単語の集合)、文書(文の集合)のような要素で捉えることができます。
技術研究
ポジネガ解析とは、与えられたテキストにどのような感情特性があるのか(ポジティブな発言が多いのか、ネガティブな発言が多いのかその度合い)を分析することを言います。最も簡単な方法では、 形態素解析によって単語に分割した後…
技術研究
文章可視化とは、テキストマイニングは大量の文章から有益な情報を抽出するための技術で、 その解析手法は様々ですが、大別するとスコアリング系のものとポジショニング系のものに分類することができます。
技術研究
名寄せとは、企業が営業活動を行ったり、システムの改善を行ったりすると、システム上に重複したデータが生まれます。 「名寄せ」とは、データの重複をなくし、データを正確に保持するための技術です。
技術研究
グラフコメンテーターとは、入力された「項目名」と「値」からできるグラフに対して、 あたかも分析者がコメントをしたような文章を、自動で作成する技術です
技術研究
情報伝送の信号は、ノイズやタイミングのずれの影響によりデータが破損し、正しく伝送できないことがあります。
技術研究