テキストマイニング・・・感性表現の分類

2007.08.03

IT・WEB

テキストマイニング・・・感性表現の分類

松尾 順
有限会社シャープマインド マーケティング・プロデューサー

「テキストマイニング」とは、企業ユースとしては、 主に、コールセンターやWebサイトなどに寄せられた 顧客の意見や感想、クレームなどの 「生の声」 を分析する方法です。

「生の声」は、「自然文」です。
すなわち、語られた言葉そのままの文章。

このため、そのままでは、

「満足という回答は、55%、不満足は45%」

といった数値で把握すること(定量化)が困難です。

ですから、こうした生の声は、

「定性情報(データ)」

と呼ばれています。

逆に、アンケート調査のように、
設問に対する答えが、

1.はい
2.いいえ

といった選択肢で示されていて、
数字(1or2)の数値データとして扱うことができ、
集計・分析が容易なものを

「定量情報(データ)」

と呼んでいます。

さて、「テキストマイニング」ですが、
その本質は、端的に言えば次のようになります。

「生の声」(自然文)という
「定性情報」を「定量情報」化すること

定性情報を定量化する具体的な手順は、
技術的・専門的になりすぎますので説明は省きます。

むしろ、実際にどんな分析結果が
テキストマイニングから得られるのかをご紹介します。

出典は、テキストマイニングの活用面に焦点を当てた新刊、

『顧客の声マネジメント テキストマイニングで本音を「見る」』(三室克哉・鈴村賢治・神田晴彦共著、オーム社)

からです。(分析に詳しくない方にも理解しやすい良書ですよ。)

なお、以下の分析例は、化粧品クチコミ情報サイト
「@コスメ」のデータを利用したものです。

肌とか化粧関連の言葉が出てきてますね。

テキストマイニングでまず最初に行う分析は、

「単語分析」

です。

具体的には、生の声の中から、
「単語」を抽出し、その出現頻度をカウントします。

(単語出現件数ランキング例)

順位 / 単 語 / 品詞の種類 / 頻度(件)
1位 / 使う / 動詞/ 2503
2位 / 良い / 形容詞 / 1300
3位 / 肌 / 名詞 /992

これは、人々がどんな単語を多く口にしているかの
全体傾向をつかむための「定量化」(頻度のランキング)
ですね。

つぎに行うのが

「係り受け分析」

です。主語と述語の関係を取り出します。

これは、ユーザーが、何(主語)に対してどんなこと(述語)
を言っているかの「組み合わせ」を把握するということです。

(係り受けランキング例)

順位 / 係り受け / 頻度(件)
1位 / 香り・良い / 90
2位 / 香り・好きだ / 73
3位 / 香り・リラックスする / 10

上の分析例を見ると、特定の化粧品に対する声として、
「香りが良い」(90件)と書いている人がもっとも多く、
次に「香りが好きだ」(73件)という答えが続いていると
いうことがわかります。

次のページ「クロス分析」

続きは会員限定です。無料の読者会員に登録すると続きをお読みいただけます。

Ads by Google

この記事が気に入ったらいいね!しよう
INSIGHT NOW!の最新記事をお届けします

松尾 順

有限会社シャープマインド マーケティング・プロデューサー

これからは、顧客心理の的確な分析・解釈がビジネス成功の鍵を握る。 こう考えて、心理学とマーケティングの融合を目指す「マインドリーディング」を提唱しています。

フォロー フォローして松尾 順の新着記事を受け取る

一歩先を行く最新ビジネス記事を受け取る

ログイン

この機能をご利用いただくにはログインが必要です。

ご登録いただいたメールアドレス、パスワードを入力してログインしてください。

パスワードをお忘れの方

フェイスブックのアカウントでもログインできます。

INSIGHT NOW!のご利用規約プライバシーポリシーーが適用されます。
INSIGHT NOW!が無断でタイムラインに投稿することはありません。