GWも終わりました・・・。天候もなかなかよく、よいGWだったと思います。
GW中は完全休養にあてまして、仕事的なものは何もしませんでした。こういっては何ですが、私くらいの年齢になりますと休むのも仕事のうちとなります。
さて、懸案のKHCoder本の方ですが、進捗は4割くらいとなります。GW中に作業しようと思いましたが上記のごとく何もしておりません・・・。
書いていて気がつきましたのは、
①特許分析に使えそうなのは
・外部変数-用語の対応分析
・外部変数-コードのクロス集計
②あまり使えそうにないのは
・用語-用語の対応分析
・用語やコードの共起ネットワーク
となります。
要は、用語同士の関連性を示すアウトプットは解釈が難しいことがわかりました。
もちろん、こじつければ何らかの解釈はできますが、細かくつっこまれますと自信のない解釈となります。
特に、共起ネットワークはテキストマイニングの花形のアウトプットですが、ここから何かを見出すのは、なかなか難しいです。
一応、本には、用語-用語と外部変数-用語の両方の手法を記載しようとは思います。
知財学会用のデータ処理も合わせて行う予定でしたが、ちょっと無理でした。
したがって、KHCoder本の作業が一区切りついたら、知財学会の作業を開始しようと思いましたが、今年の知財学会は例年より1か月早いようで、スケジュールがますます厳しくなりました。
KHCoder本は5月中に脱稿し、その後、知財学会のデータづくりをしようと思いますが、学会の方はエントリーだけして、進捗が悪ければ、最悪発表辞退となるかもしれません。