2022年4月5日火曜日

KH coderの勉強1

夜はYoutubeでgame実況をよく見ているのですが、よくみる実況者の方が就職?のためか活動停止してしまったので、見る番組もなくなり暇になりました・・・。

こういうときは、さぼっていた勉強をはじめようかと思います。

まずは、KHcoderで特許分析をした事例のリサーチをほそぼそとしたいと思います。

今日は google検索でみつけました、

KHCoder による中国特許の分析可能性評価
中国特許分析ツールの精度評価及び分析事例

を見てゆこうと思います。詳細はよくわかりませんが2016年ころの論文(第 13 回情報プロフェッショナルシンポジウムの予稿?)のようです。 

内容については、読んでいただければわかると思いますので、ここでは、出力された図に注目したいと思います。

まず、図5ですが、対応分析の図があります。


対応分析によれば、外部変数(図5の「出願年」(赤い四角))と用語(緑の丸)の関係性がわかるとされます。図5で言えば、「出願年」のまわり(正確には原点からの方向と距離)の用語をみることで、「出願年」ごとの特徴語がわかるようです。

外部変数を「出願人」とすれば、「出願人」ごとの特徴語もわかるわけです。ただし、図5は中国語ですので、よくはわかりませんが・・・。

次に、図6ですが多次元尺度分析の図があります。


多次元尺度分析によれば、共起する用語の組み合わせを視覚化できる、とされます。散布図で近い用語は出現パターンが似通っているということになります。

共起する用語のグループをみれば、テーマやトピックを読み取れるそうです。図6では、用語のグループから、特徴技術を読み取っているようです。丸による囲い方がポイントですね。

これは、どういうときに使ったらよい分析法でしょうか・・・。クラスタ分析とは違うんですかね?

まあ、こういう分析もあるということを覚えておきましょう。

【PR】“AI、生成AI”による知財業務の効率化、スピード化のセミナーについて(9/27開催)

掲題の件、セミナーの1/4を担当することになりました。私の担当分は、「【第2部】生成AIで革新する特許データ分析」です。URLは以下となります。 AI 生成AI 特許調査 分析 翻訳 技術情報協会はセミナー・出版・通信教育を通じて企業の最前線に立つ研究者、技術者をサポートし社会に...