2022年4月5日火曜日

KH coderの勉強1

夜はYoutubeでgame実況をよく見ているのですが、よくみる実況者の方が就職?のためか活動停止してしまったので、見る番組もなくなり暇になりました・・・。

こういうときは、さぼっていた勉強をはじめようかと思います。

まずは、KHcoderで特許分析をした事例のリサーチをほそぼそとしたいと思います。

今日は google検索でみつけました、

KHCoder による中国特許の分析可能性評価
中国特許分析ツールの精度評価及び分析事例

を見てゆこうと思います。詳細はよくわかりませんが2016年ころの論文(第 13 回情報プロフェッショナルシンポジウムの予稿?)のようです。 

内容については、読んでいただければわかると思いますので、ここでは、出力された図に注目したいと思います。

まず、図5ですが、対応分析の図があります。


対応分析によれば、外部変数(図5の「出願年」(赤い四角))と用語(緑の丸)の関係性がわかるとされます。図5で言えば、「出願年」のまわり(正確には原点からの方向と距離)の用語をみることで、「出願年」ごとの特徴語がわかるようです。

外部変数を「出願人」とすれば、「出願人」ごとの特徴語もわかるわけです。ただし、図5は中国語ですので、よくはわかりませんが・・・。

次に、図6ですが多次元尺度分析の図があります。


多次元尺度分析によれば、共起する用語の組み合わせを視覚化できる、とされます。散布図で近い用語は出現パターンが似通っているということになります。

共起する用語のグループをみれば、テーマやトピックを読み取れるそうです。図6では、用語のグループから、特徴技術を読み取っているようです。丸による囲い方がポイントですね。

これは、どういうときに使ったらよい分析法でしょうか・・・。クラスタ分析とは違うんですかね?

まあ、こういう分析もあるということを覚えておきましょう。

note へしばらく移転します。

  https://note.com/ip_design  へしばらく移転します。