2021年5月5日水曜日

トピックモデルについて

QFDをつくるにあたっては、コーディングルールを作らねばなりません。

コーディングルールとは、とても簡単に言えば、用語のグループをつくることをいいます。MFTフレームで言えば、市場用語、機能用語、技術用語のグループをつくることとなります。

作り方としましては、グループ案を作りまして、これに該当する抽出語を当てはめてゆく、という地道な作業になります。

これは結構面倒な作業となります・・・。

さて 、やろうかとしましたところ、KHcoderにトピックモデル機能が実装されたとのお知らせがありました。

トピックモデルとは、教師なし学習の一種で、特定の文書は複数のトピックを含むという仮説のもとに、トピックごとの用語を抽出する、という処理になります。

そうしますと、トピックモデルを使用することにより、市場トピックに関連する用語、機能トピックに関連する用語、技術用語に関連する用語、を機械学習にて、抽出してくれる・・・ということもできるかなと思います。

今年の知財学会の発表予定は、テキストマイニングによるMFTモデルの作成、となりますが、実のところ裏のテーマとしましては、トピックモデルによるコーディングルールの(ある程度の自動)作成となります。

これができますと、QFD作成作業がさらに省力化できます・・・(できない可能性もあります・・・)。

しかし、無料のツールで、ここまでの処理ができる時代となりました・・・。おどろきです。

いずれにせよ、事例づくりはいったん中断して、トピックモデルの操作法をまず、確認したいと思います。

【PR】“AI、生成AI”による知財業務の効率化、スピード化のセミナーについて(9/27開催)

掲題の件、セミナーの1/4を担当することになりました。私の担当分は、「【第2部】生成AIで革新する特許データ分析」です。URLは以下となります。 AI 生成AI 特許調査 分析 翻訳 技術情報協会はセミナー・出版・通信教育を通じて企業の最前線に立つ研究者、技術者をサポートし社会に...