投稿開始から10年以上たち、KY法を取り巻く環境は激変致しました。KY法の適用が際立つ「ビッグデータ」時代に突入しました。 More than 10 years have passed since the posting started, and the environment surrounding the KY method has changed drastically.
KY法に関する本ブログの立ち上げは2010年の2月でした。この時からほぼ12年経ちました。この間、本ブログが存在し続けたことも大変なことですが、外的な環境の変化、特にIT技術に関する環境の変化は想像を絶するほどの拡大をし続けてまいりました。この結果、大量のデータを扱うことが可能で必要となる「ビッグデータ」時代に突入いたしました。
本ブログを立ち上げた2010年代では大量のデータが集まっておらず、データ解析も少量、限られた数を用いてのデータ解析が主体となる時代でした。従って、KY法が発明された2010年代では分類率が100%を達成したとしても、少ないサンプルを用いた通常の解析手法であっても100%に近い値を実現するので、KY法の優位性は目立ちませんでした。
「ビッグデータ」時代に突入した現在、KY法は大量のサンプルを扱うことが可能という特徴が大きくクローズアップされてきました。一般的に通常展開されているニクラス分類手法は、サンプル数が大きくなると分類率が低下するという傾向があります。サンプル数が100の時の分類率90%は10サンプルのみの誤分類ですが、10000では1000サンプルが、100000では10000サンプルが誤分類となり、サンプル数が大きくなると誤分類の影響は極めて大きくなります。サンプル数が大きくなると分類率も下がるのであれば、誤分類の悪影響はさらに拡大します。
KY法はその分類率はサンプル数の影響を受けないことが大きな特徴です。サンプル数が100,10000,100000に急増しても分類率はほとんど変化なく、はぼ100%分類を実現します。これはKY法のアルゴリズムから明白です。
十数年を経てKY法を取り巻く環境は激変し、KY法は正に時代が求める要求に答えることの出来る強力な機能を有するデータ解析手法であることが明らかとなりました。今後、現在の環境に関した討論を活発に進めてゆきたいと考えております。よろしくご支援お願いいたします。
なお、KY法に関する議論は他のブログでも行っておりますので、そちらのKY法関連ブログもご参照ください。