前に宣言しましたように、学会用のデータづくりをしております。しかし、休んで免疫を維持することも重要ですので、適当にやっています。
今は、ニーズのコードをどうするか考えております。
今回は(今回も?)、あまり自分の頭で考えず、ソフトウェアの力を借りて、できるだけ機械的にデータを処理してゆこうと思います。
手順としては、レビュー情報収集→形態素解析→クラスタ分析→コードを考える、という手順となります。
レビュー情報につきましては、前回はP&Gとネピアをやりましたので、今回はユニ・チャームと花王のレビューを合わせて1000件程度収集しました。
これをKHcoderに取り込んで、クラスタ分析をしてみました。
クラスタの数は10くらいが適当かと思われるため、クラスタ数を少し多めに12にして、各クラスタに対応する特徴語を抽出したのが以下の図となります。
この特徴語からニーズを考えるのですが・・・、かなり推測しませんとわかりません。
ひとまず、「持ち運びが楽」、「着心地がよい」、「サイズがよい」、「交換しやすい」、「子供に似合う」があるかということになるとしました。
今回ニーズは深堀しませんので、このくらいでよしとして、次の作業に移ろうと思います。