2021年5月18日火曜日

機能トピックについて

 白いノートに青いボールペンを持っている人

GWが終わり、大分間が開いてしまいましたが、作業を進めたいと思います。平日は弁理士実務で疲れてしまい、事例づくりが滞り気味となってしまいます。

今回は機能トピックを抽出したいと思います。いろいろ考えましたが、機能トピックはサ変名詞から抽出することにしたいと思います。

これは、今後、構成トピックを抽出する予定ですが、機能トピックと構成トピックとの名詞の重複を避けるためです。ただし、これは正しいやり方ではないかもしれません。

まずは、トピック数ですが、トピック数の目安を探る機能がKHcoderにありますので、 それを使用します。

 

そうしますと、14くらいが候補となることがわかります・・・。

トピック数14で機能トピックを抽出すると以下のようになります。

それで、各トピックの意味を把握するのですが、これが中々難儀となります。考えてもしょうがないので、ひとまず機能トピックは以下のようにしました。

ということで次は、構成トピックを考えたいと思います。

2021年5月8日土曜日

国語的な技術の理解について

私は、昔某私立中学に通っておりましたが、今でも当時のことが夢に出てきて、うなされて目が覚めることがります。

当時の私は成績が非常に悪く(学年の下から一桁台)、特に、国語系の成績が10段階中、2,3しかありませんでした。成績が3以下が1つでもありますと、問答無用で留年or退学となります。

学期の初めに教師に呼び出され、留年or退学勧告がなされるのが常でしたので、当時の記憶が悪夢となって今でも甦ることになっております。

その後、理系の大学に進んだのも、理系の勉強がしたいという積極的な理由ではなく、国語ができないという消極的な理由からでした。

(よくよく考えますと、このような消極的な理由で物事を選択しますと、人生も消極的になりがちで、今考えますとよくない気がします。)

弁理士を志すにあたって問題となりましたのが、試験の難易度もさることながら、この国語への苦手意識でした。

と、前置きが長くなりましたが、以下の内容は国語力のない人間の駄文となりますことの言い訳でした

KHcoderで文書を分析しますと、技術を文書で考えるという思考になります。技術を国語的に表しますと、以下のような感じとなります

「AはBをCする。」

Aは、主語(主体)であり、名詞となります。

Bは、目的語(客体)であり、名詞となります。

Cは、動詞(orサ変名詞)となります。

掃除機で言えば

フィルタはほこりを除去する。となります。

「フィルタ」は「名詞」、「ほこり」は「名詞」、「除去する」は「サ変名詞」、となります。

特許的に言えば

「フィルタ」は「構成」、「ほこりを除去する」は「機能」となります。

この「AはBをCする。」の多数の組み合わせが、「装置」となります。

なぜ、こういう話をしたかといいますと、今、ダイソンの出願について、トピックモデルの処理を行っておりますので、トピックモデルは品詞ごとに作成できることから、どのような品詞を使用するか検討しているからです。

以下は、トピック数20で、名詞+サ変名詞でトピックを抽出した結果となります。


希望としては、構成トピックと機能トピックを抽出しようかと考えております。

構成トピックは「名詞」でトピックモデルを生成し、機能トピックは「名詞+サ変名詞」でトピックモデルを生成することになりますが、両トピックとも「名詞」を使用していることが悩ましいところとなります。

つまり、構成と機能(の目的語)の「名詞」が混在しておりますので、分離できませんと、構成トピックと機能トピックに使用される「名詞」が重複することとなります。

とはいえ、これはソフト的な限界を超えておりますので、人力で目で見て分類するしかないと思います。 

ということで、トピックモデルを使用しても、全部ソフトにお任せとはならず、人力にて処理する部分が残る予定です。

ひとまず、人力で処理して、コーディングルールを作成しようと思います。

2021年5月6日木曜日

テキストマイニングを使用した多空間デザインモデルの作成について

掲題の論文ですが、無料公開されました。

パテント誌へのリンク(PDF) 

内容としては、特許情報から多空間デザインモデルを作成し、その多空間デザインモデルから新規な発明を生成する、ということをやりました。

論文前半はインダクションによる推論、後半はアブダクションによる推論となります。 

特許情報のみから発明を構成する、ということを世界で初めてやってみたのですが、ほとんど話題にはなりませんでした・・・。

発明とは個人が苦労してなすべきであり、特許情報を適当に組み合わせて発明を構成するのはけしからん!と炎上するかと思ったのですが、そういうこともありませんでした・・・。

しかしながら、近い将来には、この論文のような感じで発明をするのが普通となっていると思料します。

ということで、ぜひご覧いただければと思います。

2021年5月5日水曜日

トピックモデルについて

QFDをつくるにあたっては、コーディングルールを作らねばなりません。

コーディングルールとは、とても簡単に言えば、用語のグループをつくることをいいます。MFTフレームで言えば、市場用語、機能用語、技術用語のグループをつくることとなります。

作り方としましては、グループ案を作りまして、これに該当する抽出語を当てはめてゆく、という地道な作業になります。

これは結構面倒な作業となります・・・。

さて 、やろうかとしましたところ、KHcoderにトピックモデル機能が実装されたとのお知らせがありました。

トピックモデルとは、教師なし学習の一種で、特定の文書は複数のトピックを含むという仮説のもとに、トピックごとの用語を抽出する、という処理になります。

そうしますと、トピックモデルを使用することにより、市場トピックに関連する用語、機能トピックに関連する用語、技術用語に関連する用語、を機械学習にて、抽出してくれる・・・ということもできるかなと思います。

今年の知財学会の発表予定は、テキストマイニングによるMFTモデルの作成、となりますが、実のところ裏のテーマとしましては、トピックモデルによるコーディングルールの(ある程度の自動)作成となります。

これができますと、QFD作成作業がさらに省力化できます・・・(できない可能性もあります・・・)。

しかし、無料のツールで、ここまでの処理ができる時代となりました・・・。おどろきです。

いずれにせよ、事例づくりはいったん中断して、トピックモデルの操作法をまず、確認したいと思います。

note へしばらく移転します。

  https://note.com/ip_design  へしばらく移転します。