2022年4月5日火曜日

KH coderの勉強1

夜はYoutubeでgame実況をよく見ているのですが、よくみる実況者の方が就職?のためか活動停止してしまったので、見る番組もなくなり暇になりました・・・。

こういうときは、さぼっていた勉強をはじめようかと思います。

まずは、KHcoderで特許分析をした事例のリサーチをほそぼそとしたいと思います。

今日は google検索でみつけました、

KHCoder による中国特許の分析可能性評価
中国特許分析ツールの精度評価及び分析事例

を見てゆこうと思います。詳細はよくわかりませんが2016年ころの論文(第 13 回情報プロフェッショナルシンポジウムの予稿?)のようです。 

内容については、読んでいただければわかると思いますので、ここでは、出力された図に注目したいと思います。

まず、図5ですが、対応分析の図があります。


対応分析によれば、外部変数(図5の「出願年」(赤い四角))と用語(緑の丸)の関係性がわかるとされます。図5で言えば、「出願年」のまわり(正確には原点からの方向と距離)の用語をみることで、「出願年」ごとの特徴語がわかるようです。

外部変数を「出願人」とすれば、「出願人」ごとの特徴語もわかるわけです。ただし、図5は中国語ですので、よくはわかりませんが・・・。

次に、図6ですが多次元尺度分析の図があります。


多次元尺度分析によれば、共起する用語の組み合わせを視覚化できる、とされます。散布図で近い用語は出現パターンが似通っているということになります。

共起する用語のグループをみれば、テーマやトピックを読み取れるそうです。図6では、用語のグループから、特徴技術を読み取っているようです。丸による囲い方がポイントですね。

これは、どういうときに使ったらよい分析法でしょうか・・・。クラスタ分析とは違うんですかね?

まあ、こういう分析もあるということを覚えておきましょう。

【セミナー告知】生成AIで知財業務を効率化・高度化!

  【セミナー告知】生成AIで知財業務を効率化・高度化!特許調査や明細書作成等への活用法を解説します。GPT-5の実演も予定 知財×AI活用にご関心のある方はぜひご参加ください。 お申込み→ https:// science-t.com/seminar/B25085 1.html