大量のテクストデータを読み解く2005/06/22 06:41

 従来、こうした意味的「社会」研究の阻害要因だったのは、「意味表出データ」 のアベイラビリティの不足、意味の問題を取り扱える理論の不在などだった。  今、インターネットはテクストデータの宝庫である。 あらゆる人がコトバで 意味表出をしている。 コトバは意味連関構造を示す。 テクストデータは意 味世界研究の基軸データなのである。

 深谷昌弘さんは、この大量のテクストデータを利用するために、二つの課題 に挑んだ。 1. コトバと意味との関係を、新しいコミュニケーション理論、意味づけ論 によって、捉え直した。(ソシオセマンティクス(社会意味論)と呼ぶ)  2. 大量のテクストデータを読み解くツールとなる意味空間分析システムの 開発。

 具体的な例。 人々は携帯電話について、どう考えているか。 ここに携帯 電話に対する不満のアンケート結果がある。 そのデータをコンピューターに 入れると、出現語頻度表、係り受け頻度表、基礎意味チャンク(かたまり)一覧 表、基礎意味チャンク集計表を打ち出す。 コンピューターが解析(数で数えら れるように)し、人間がそれを解釈するのだ。 「子供」が携帯電話を持つこと の是非、「何歳」なら許容されるか、などという問題について、人々がどう考え ているかが、捉まえられる。

 応用分野としては、政策立案、ブランド戦略、マーケッティング、コールセ ンター・営業日報などを手がかりとした業務改善など。 数年先、CIAからア メリカの評判をまとめてくれという依頼がきたり、SONYやトヨタなどの企業 から会社のイメージや製品の評判の調査が殺到するようになればと、深谷昌弘 さんは言った。