本年もよろしくお願いいたします。
今日は出願人件数ランキングのグラフを書いてみました。
簡単に書けそうなグラフではありますが、そうでもありません。
j-platpatのcsvのダウンロードファイルでは、出願人の要素には1社(例えば、A社)だけでななく、共願の複数社(A社、B社)が記入されていることがあります。
したがって、普通にカウントしますと、「A社」と「A社、B社」は別カウントになりますので、
A社・・・1件
A社、B社・・・1件
とカウントされます。
しかし、
A社・・・2件
B社・・・1件
とカウントするのが正確なような気もします。
このようなカウントはexcelではできない(正確には、できるのかもしれないが、自分にはできない)ので、しかたなく筆頭出願人を抽出してカウントしたりしています。したがって、筆頭以外の出願人は無視することになります。
今回pythonで、共願もカウントされるようプログラムを書いて出力したのが上図となります。
自分でコードを書くのは1日かかりましたが、googleで調べましたらたった、2行のコードで上記処理を行った例を発見しましたので、そちらを採用することにしました・・・。
ということで、共願もカウントできるようになりましたが、問題がないわけでもありませんので、しばらくは、筆頭出願人抽出と併用して使用しようかなと思います。