パターン認識の流れは次のようになります。
1)計測 2)前処理 3)特徴解析 4)分類/識別
計測は、画像を撮影したりマイクで音を収録することを指します。このステップではできる限り真の情報を計測することが必要です。そのためには、ノイズを抑制することや画像や音に関する知識が必要になります。
前処理ではノイズを低減することなどが行われます。 前処理は必要でない場合もあります。画像処理や信号処理などが使われます。
特徴解析は、生の情報が冗長である場合、つまりパターン情報の次元が大きい場合分類や識別の性能を高めることができないため、情報が持っている本質的な性質を損なうことなく次元を小さくすることをいいます。例えば、物体の形状を示す画像は縦横50画素とするとパターン情報の次元は2500になりますが、この画像の特徴を、面積や重心、周囲長などで表せば10次元程度と非常に小さくなります。この解析でも画像処理や信号処理が使われます。
分類または識別においては特徴解析結果として得られた特徴量(パターン)が事前に持っているパターンに近いかどうかを計算します。検査の場合は、良品のパターンを事前に持っておき、検査品のパターンが良品のパターンに近いかどうかを計算します。
検査の自動化を図るうえで、現在最も性能向上が求められているのは分類・識別技術です。これまでは分類・識別技術に問題があるために検査精度が十分でない場合が多くみられ、「オオカミ少年」と揶揄されることも多くありました。
これまで認識精度を向上させるために、多数の識別技術が開発されています。代表的なものとして次のものがあります。
・距離方式
ユークリッド距離やマハラノビス距離などがあります。
・相関方式
テンプレートマッチングなどがあります。
・ニューラルネットワーク(NN)方式
階層型NNなどがあります。
・統計処理方式
ベイズ法や標準化変量を使用する方法があります。パターン情報には一般にばらつきがあ
るため、パターン認識には統計処理が適当であると思われます。
ユークリッド距離は良品と検査ワークのパターン情報(多次元ベクトル)の距離を計算し、その値が小さい場合は良品、大きい場合は不良品と判断します。一見ユークリッド距離を計算すると良否判定が簡単に行えそうですが、実際には精度が不足して使えません。マハラノビス距離は各要素の相関を考慮したもので、ユークリッド距離より高度な識別技術ですが、最低限次元数の数より1だけ多い数のサンプルが必要になります。例えば、100万次元の画像の検査を行うためには100万1個の良品データが必要になります。この点から、マハラノビス距離を適用するためには特徴解析を行い特徴量の次元を下げる必要があると考えられます。
テンプレートマッチングはよく画像認識に使用されます。これは良品と検査ワークの各画素同士の相関を計算して大きいほど良品と判定する方法です。この方法はカテゴリ間の線形分離しかできないため、検査性能には限界があります。
ニューラルネットワーク方式は、非線形分離が可能なため検査精度が非常に高くなるために期待されました。しかし、学習していないものを正しく認識することができないため、実用できないことがわかりました。なお、弊社代表取締役が開発した境界学習型ニューラルネットワークは学習していないカテゴリの誤判定を抑制することに成功し、パターン検査装置として実用化できました。パターン検査装置の要件の中の検査精度については満足できましたが、その他の要件については改良の余地があります。
なお、近年ニューラルネットワークが発展しディープラーニング技術が開発されました。この技術はパターン認識としては従来技術と比較して圧倒的な性能があります。ただし、学習データを多数必要とするため個別の問題に適用するよりも汎用的な問題に適用するのが適切ではないかと思います。
標準化変量を使用する検査装置も各種開発されましたが、従来は自動判定ができないものでした。弊社では新規に類似度を導入することにより自動判定を可能としました(ご参考)。併せて、残りのパターン検査装置の要件も満足することができ、現状では実用性の高い数少ない検査装置となっています。
パターン検査豆知識のトップページはこちら
弊社トップページはこちら