パターン検査とは

 パターン検査とは、画像や音などの空間的あるいは時間的な情報(パターン情報)を基にして、製品の良否を判別する検査のことを指します。例えば、製品の表面に傷があるかないかを検査する外観検査や、完成した自動車エンジン音を聞いてエンジンの良否を検査する異音検査などがあります。パターン検査は製品の重量や寸法などの検査と比較すると、自動化が難しい検査です。

 例えば、重量の検査の場合は検査品の重量が2つの値の間にあれば良品と判断できます。しかし、パターン検査の最も簡単な例として平面的な傷の検査を考えて見ます。すると、丸い傷や細長い傷などがあり、傷の形状は複雑で簡単に良否の判定ができなくなります。この場合、傷の状態を決める値は2方向の傷の寸法、すなわち2次元の特徴量ですが、特徴量が1次元から2次元になっただけで問題は非常に難しくなることが分かります。パターン検査の場合は、画像などでは数100万次元、音や振動などの周波数スペクトルの場合で数100次元となり、その難しさは格段に違います。

  このため、製品によってはパターン検査は人間の視覚や聴覚などを利用する官能検査により行われています。

弊社トップページはこちら

官能検査の問題点

 しかし、人間が検査を行う場合、ワークを動かしながら検査をするなど非常に優れた検査が可能ですが、一方で官能検査には以下の問題点があります。

  • 客観性が十分ではない。
  • 検査には熟練を要する。
  • 検査する人によって検査基準が同じとはいえない。
  • 製造の高度化に対応できない。

 弊社ではこのような検査を自動化する装置としてStaVaTester(スタバテスター)を製造販売しています。統計と新しいパターン認識技術を使用して簡単に高精度の検査ができる装置です。

パターン検査装置の要件

 以上のことから、パターン検査は自動化が望まれます。そして、パターン検査装置は以下のような特徴を持つことが望まれます。

  • 人間の判断に近い。
  • 検査精度が高い。
  • 検査対象の種類が替わっても対応が容易である。
  • 検査対象の種類が替わっても短時間で対応できる。
  • 検査速度が速い。

 弊社のStaVaTesterは、長期にわたるパターン認識技術の研究から導いた斬新な検査方法を適用しているため、これらの要件を満足する数少ないパターン検査装置です。

パターン認識とは

 以降は、StaVaTesterが使用しているパターン認識技術の位置づけについて基礎的なことも含めて説明します。

  画像や音声などの空間的あるいは時間的な情報をパターン情報と呼びます。そして、一般的にはパターン情報はベクトル量になります。例えば、画像は各画素の強度値からなるベクトル量で表されます。音声は大気圧からの変動圧力として定義されますが、マイクなどの出力波形で可視化することができます。そこで、音のパターン情報は時刻ごとの変動圧力値からなるベクトル量で表されます。

 パターン認識.jpg

   パターン認識とは、このようなパターン情報を識別したり、分類したりすることを言います。よく知られているものでは、文字認識や音声認識があります。これらは1950年ごろから研究されていますが、未だに人間の能力と比較すると比べ物にならないくらい認識能力は低い状態です。このように、パターン認識というのは非常に難しい技術として知られています。
 外観検査などで使用されるものにも、パターン認識技術を適用するものがあります。例えば、文字認識や傷検査などにもパターン認識技術が適用される場合があります。


パターン検査豆知識のトップページはこちら

弊社トップページはこちら

パターン認識の種類

 パターン認識の応用としては、文字認識のように、示された画像が「A」なのか「B」なのかといったように分類するという応用と、外観検査のように、示された画像が良品なのか不良品なのかを識別する応用があります。
 分類応用の場合は、各グループ同士の違いは大きいけれども、グループ内の要素間のばらつきが大きいことがパターン認識を難しいものにしています。またノイズなども精度低下の大きな原因になります。
 良否の識別を行う場合は、良品と不良品との違いが非常に小さいということがパターン認識を難しいものにしています。更に、良品のばらつきが大きいほど、ノイズが大きいほど識別精度が悪くなります。

 
パターン検査豆知識のトップページはこちら

弊社トップページはこちら

識別技術

 パターン認識の流れは次のようになります。

1)計測  2)前処理  3)特徴解析  4)分類/識別

 計測は、画像を撮影したりマイクで音を収録することを指します。このステップではできる限り真の情報を計測することが必要です。そのためには、ノイズを抑制することや画像や音に関する知識が必要になります。 
 前処理ではノイズを低減することなどが行われます。 前処理は必要でない場合もあります。画像処理や信号処理などが使われます。 
 特徴解析は、生の情報が冗長である場合、つまりパターン情報の次元が大きい場合分類や識別の性能を高めることができないため、情報が持っている本質的な性質を損なうことなく次元を小さくすることをいいます。例えば、物体の形状を示す画像は縦横50画素とするとパターン情報の次元は2500になりますが、この画像の特徴を、面積や重心、周囲長などで表せば10次元程度と非常に小さくなります。この解析でも画像処理や信号処理が使われます。 
 分類または識別においては特徴解析結果として得られた特徴量(パターン)が事前に持っているパターンに近いかどうかを計算します。検査の場合は、良品のパターンを事前に持っておき、検査品のパターンが良品のパターンに近いかどうかを計算します。

 検査の自動化を図るうえで、現在最も性能向上が求められているのは分類・識別技術です。これまでは分類・識別技術に問題があるために検査精度が十分でない場合が多くみられ、「オオカミ少年」と揶揄されることも多くありました。

 これまで認識精度を向上させるために、多数の識別技術が開発されています。代表的なものとして次のものがあります。

 
・距離方式
  ユークリッド距離やマハラノビス距離などがあります。


・相関方式
  テンプレートマッチングなどがあります。


・ニューラルネットワーク(NN)方式
  階層型NNなどがあります。


・統計処理方式
  ベイズ法や標準化変量を使用する方法があります。パターン情報には一般にばらつきがあ
 るため、パターン認識には統計処理が適当であると思われます。

 

 ユークリッド距離は良品と検査ワークのパターン情報(多次元ベクトル)の距離を計算し、その値が小さい場合は良品、大きい場合は不良品と判断します。一見ユークリッド距離を計算すると良否判定が簡単に行えそうですが、実際には精度が不足して使えません。マハラノビス距離は各要素の相関を考慮したもので、ユークリッド距離より高度な識別技術ですが、最低限次元数の数より1だけ多い数のサンプルが必要になります。例えば、100万次元の画像の検査を行うためには100万1個の良品データが必要になります。この点から、マハラノビス距離を適用するためには特徴解析を行い特徴量の次元を下げる必要があると考えられます。

 テンプレートマッチングはよく画像認識に使用されます。これは良品と検査ワークの各画素同士の相関を計算して大きいほど良品と判定する方法です。この方法はカテゴリ間の線形分離しかできないため、検査性能には限界があります。

 ニューラルネットワーク方式は、非線形分離が可能なため検査精度が非常に高くなるために期待されました。しかし、学習していないものを正しく認識することができないため、実用できないことがわかりました。なお、弊社代表取締役が開発した境界学習型ニューラルネットワークは学習していないカテゴリの誤判定を抑制することに成功し、パターン検査装置として実用化できました。パターン検査装置の要件の中の検査精度については満足できましたが、その他の要件については改良の余地があります。

 なお、近年ニューラルネットワークが発展しディープラーニング技術が開発されました。この技術はパターン認識としては従来技術と比較して圧倒的な性能があります。ただし、学習データを多数必要とするため個別の問題に適用するよりも汎用的な問題に適用するのが適切ではないかと思います。

 標準化変量を使用する検査装置も各種開発されましたが、従来は自動判定ができないものでした。弊社では新規に類似度を導入することにより自動判定を可能としました(ご参考)。併せて、残りのパターン検査装置の要件も満足することができ、現状では実用性の高い数少ない検査装置となっています。


パターン検査豆知識のトップページはこちら

弊社トップページはこちら