2013年7月28日日曜日

吐き捨てた言葉も金に換わる時代?



テキストマイニング - Wikipedia:


TwitterFacebookやブログ等々と云ったソーシャルメディアは、誰もが参加出来る情報発信技術を使って、社会的インタラクションを通じて拡大していく様に設計されたメディアとしてWeb2.0を具現化したモノとされる。


Web2.0とは概念であり、特にWeb(バージョン)1.0に対しての技術的上位バージョンと云う意味合いではなく旧来の情報技術を使っていても新機軸のサービスであると云う概念であり、「新世代」と云うジョークである。我が家では、昨日の「鍋」の残りを冷蔵庫保存し、翌日にあり合わせの材料を加え味付けを手直ししてリニューアルした「鍋」の事を「鍋2.0」と呼んでいたが、概念としては同じである。


そんなソーシャルメディアの成功により、個人発の情報発信が可視化し易くなった事でSNSの枠を越えた新たな商用利用が始まっているのだ。TwitterFacebookやブログ等のWeb2.0世代のサービスだけではなく旧来サービスであった掲示板やアンケートサイトやメーリングリストのログ等々の自然文の蓄積の形で存在するテキスト・データから有意な何かを発掘(マイニング:mining = 発掘)する技術である。定型化されていない文章の集まりを言語解析技術で単語やフレーズや文法の解析を行い、出現頻度や相関関係を分析して有益な情報を抽出するシステムをテキストマイニングと呼ぶ。

年齢性別職業を登録していなくても特定の検索エンジンを使い続けていると、検索語から年齢性別職業家族構成等々を導き出すヒントが抽出されて、それに基づいて、利用者に相応しい検索結果の表示順番とかWeb広告が表示される様にチューニングされていき、知らず知らずの内に欲しがるだろう商品への潜在的購入願望を育まれていってしまうなんて事になっている。

以前から某巨大掲示板の掲示板群は商品開発やクレーム抽出の為にメーカーの開発に携わる人員がスレを監視して場合に依っては介入してくるとの噂が有ったが、1つ1つ読んでいき分析を加え意味のある形や数値化定型化し有用なデータに変える事は非常に難しかったが、早い段階からテキストマイニングを導入して成果を上げている。他にも商品開発やクレーム処理の現場では、製品の評価を調べたりクレームを抽出したり、更に、時系列での推移もマイニングされるようになってきた。又、急激に進化した音声認識技術を背景にコールセンター等での顧客とオペレーターとのやり取り記録や営業窓口での会話等々も音声による自然文の蓄積もマイニング対象として有用な何かを掘り出す事が始まっていて、従来型のアンケートサイトでの欠点(実際の潜在顧客や顧客では無い人も謝礼欲しさに適当な回答をしてデータを乱すとか、アンケート向けに構えた事実に反する回答をするとか・・・)を排除する事が可能となるのだ。そして、一定のアルゴリズムで抽出し自動分類しデータベース化すれば自動的にナレッジを積み上げ活用し続ける事が可能となる。

この分野では常に最先端を走っていたGoogleだったが、日本語による自由文音声認識は既存の第一種電気通信事業者にも勝機が見えてくる。米国ではGoogleの無料通話サービスも一定のシェアを得ているが、日本でのサービス開始は未定だ。

電気通信事業法
第四条  電気通信事業者の取扱中に係る通信の秘密は、侵してはならない。
  電気通信事業に従事する者は、在職中電気通信事業者の取扱中に係る通信に関して知り得た他人の秘密を守らなければならない。その職を退いた後においても、同様とする。




0 件のコメント:

コメントを投稿