2021年5月5日水曜日

トピックモデルについて

QFDをつくるにあたっては、コーディングルールを作らねばなりません。

コーディングルールとは、とても簡単に言えば、用語のグループをつくることをいいます。MFTフレームで言えば、市場用語、機能用語、技術用語のグループをつくることとなります。

作り方としましては、グループ案を作りまして、これに該当する抽出語を当てはめてゆく、という地道な作業になります。

これは結構面倒な作業となります・・・。

さて 、やろうかとしましたところ、KHcoderにトピックモデル機能が実装されたとのお知らせがありました。

トピックモデルとは、教師なし学習の一種で、特定の文書は複数のトピックを含むという仮説のもとに、トピックごとの用語を抽出する、という処理になります。

そうしますと、トピックモデルを使用することにより、市場トピックに関連する用語、機能トピックに関連する用語、技術用語に関連する用語、を機械学習にて、抽出してくれる・・・ということもできるかなと思います。

今年の知財学会の発表予定は、テキストマイニングによるMFTモデルの作成、となりますが、実のところ裏のテーマとしましては、トピックモデルによるコーディングルールの(ある程度の自動)作成となります。

これができますと、QFD作成作業がさらに省力化できます・・・(できない可能性もあります・・・)。

しかし、無料のツールで、ここまでの処理ができる時代となりました・・・。おどろきです。

いずれにせよ、事例づくりはいったん中断して、トピックモデルの操作法をまず、確認したいと思います。

note へしばらく移転します。

  https://note.com/ip_design  へしばらく移転します。