独自の高性能識別技術

株式会社竹田技研

〒702-8057 岡山市南区あけぼの町25-5

受付時間
9:00~17:00
定休日
土曜・日曜・祝日
お気軽にお問合せください
086-259-0568

パターン検査とは

パターン検査とは、画像や音などの空間的あるいは時間的な情報(パターン情報)を基にして、製品の良否を判別する検査のことを指します。例えば、製品の表面に傷があるかないかを検査する外観検査や、完成した自動車エンジン音を聞いてエンジンの良否を検査する異音検査などがあります。パターン検査は製品の重量や寸法などの検査と比較すると、自動化が難しい検査です。

例えば、重量の検査の場合は検査品の重量が2つの値の間にあれば良品と判断できます。しかし、パターン検査の最も簡単な例として平面的な傷の検査を考えて見ます。すると、丸い傷や細長い傷などがあり、傷の長短も考えると傷の形状は複雑で簡単に良否の判定ができなくなります。この場合、傷の状態を決める値は2方向の傷の寸法で2次元の特徴量ですが、特徴量が1次元から2次元になっただけで問題は非常に難しくなることが分かります。パターン検査の場合は、画像などでは数100万次元、音や振動などの周波数スペクトルの場合で数100次元となり、その難しさは格段に違います。

このため、これまでは自動化がうまく行かないケースが多くみられます。そこで、パターン検査を自動化するためには有効な検査原理を使用することが重要になります。

パターン検査装置の要件

ここで、パターン検査装置は以下のような特徴を持つことが望まれます。

・人間の判断に近い。

・検査精度が高い。

・検査対象の種類が替わっても対応が容易である。

・検査対象の種類が替わっても短時間で対応できる。

・検査速度が速い。

当社のStaVaTesterは、従来のパターン認識技術の根本的な問題点を解消しているため、これらの要件を満足する数少ないパターン検査装置といえます。

以下、この点について詳しく説明します。

パターン認識とは

画像や音声などの空間的あるいは時間的な情報をパターン情報と呼びます。そして、一般的にはパターン情報はベクトル量になります。例えば、画像は各画素の強度値からなるベクトル量で表されます。音声は大気圧からの変動圧力として定義されますが、マイクなどの出力波形で可視化することができます。そこで、音のパターン情報は時刻ごとの変動圧力値からなるベクトル量で表されます。

画像の説明を入力してください

パターン認識とは、このようなパターン情報を識別したり、分類したりすることを言います。よく知られているものでは、文字認識や音声認識があります。これらは1950年ごろから研究されていますが、未だに人間の能力と比較すると認識能力は低い状態です。このように、パターン認識というのは非常に難しい技術として知られています。 
外観検査などで使用されるものにも、パターン認識技術を適用するものがあります。例えば、文字認識や傷検査などにもパターン認識技術が適用される場合があります。

パターン認識の種類

パターン認識の応用としては、文字認識のように、示された画像が「A」なのか「B」なのかといったように分類するという応用と、外観検査のように、示された画像が良品なのか不良品なのかを識別する応用があります。

分類応用の場合は、各グループ同士の違いは大きいけれども、グループ内の要素間のばらつきが大きいことがパターン認識を難しいものにしています。またノイズなども精度低下の大きな原因になります。

良否の識別を行う場合は、良品と不良品との違いが非常に小さいということがパターン認識を難しいものにしています。更に、良品のばらつきが大きいほど、ノイズが大きいほど識別精度が悪くなります。

 

パターン認識のフロー

パターン認識の流れは次のようになります。

1)計測  2)前処理  3)特徴解析  4)分類/識別

計測は、画像を撮影したりマイクで音を収録することを指します。このステップではできる限り真の情報を計測することが必要です。そのためには、ノイズを抑制することや画像や音に関する知識が必要になります。

前処理ではノイズを低減することなどが行われます。 前処理は必要でない場合もあります。画像処理や信号処理などが使われます。

特徴解析は、生の情報が冗長である場合、つまりパターン情報の次元が大きすぎる場合、分類や識別の性能を高めることができないため、情報が持っている本質的な性質を損なうことなく次元を小さくすることをいいます。例えば、物体の形状を示す画像は縦横50画素とするとパターン情報の次元は2500になりますが、この画像の特徴を、面積や重心、周囲長などで表せば10次元程度と非常に小さくなります。この解析でも画像処理や信号処理が使われます。

分類または識別においては特徴解析結果として得られた特徴量(パターン)が事前に持っているパターンに近いかどうかを計算します。検査の場合は、良品のパターンを事前に持っておき、検査品のパターンが良品のパターンに近いかどうかを計算します。

検査の自動化を図るうえで、現在最も性能向上が求められているのは分類・識別技術です。これまでは分類・識別技術に問題があるために検査精度が十分でない場合が多くみられ、「オオカミ少年」と揶揄されることも多くありました。

識別技術の種類

これまで認識精度を向上させるために、多数の識別技術が開発されています。代表的なものとして次のものがあります。

〇解析的方法

・距離方式
  ユークリッド距離やマハラノビス距離などがあります。

・相関方式 
  テンプレートマッチングなどがあります。

〇人工知能的方法

・ニューラルネットワーク(NN)方式 
  階層型NNなどがあります。

〇統計的方法

StaVaTester方式 

・従来法
 ベイズ法や標準化変量を使用する方法があります。パターン情報には一般にばらつきがあるため、パターン認識には統計処理が適当であると思われます。

ここで、パターン認識技術の識別性能を表す指標として、第1種エラー率と第2種エラー率があります。第1種エラー率は当該カテゴリに属すパターンを当該カテゴリに属さないと誤判定する割合を示します。例えば、良否検査において、良品を不良品と誤判定(過検出)する割合を示します。第2種エラー率は当該カテゴリに属さないパターンを当該カテゴリに属すると誤判定する割合です。例えば、良否検査において、不良品を良品と誤判定(見落し)する割合を示します。

そこで、パターン検査装置には第1種エラー率と第2種エラー率がともに低いことが求められます。この観点から従来の識別技術を評価すると次表のようになります。

ユークリッド距離は良品と検査ワークのパターン情報(多次元ベクトル)の距離を計算し、その値が小さい場合は良品、大きい場合は不良品と判断します。一見ユークリッド距離を計算すると良否判定が簡単に行えそうですが、実際には精度が不足して使えません。マハラノビス距離は各要素の相関を考慮したもので、ユークリッド距離より高度な識別技術ですが、最低限次元数の数より1だけ多い数のサンプルが必要になります。例えば、100万次元の画像の検査を行うためには100万1個の良品データが必要になります。この点から、マハラノビス距離を適用するためには特徴解析を行い特徴量の次元を下げる必要があると考えられます。これらの方法はカテゴリ間の線形分離しかできないため、検査性能には限界があります。

テンプレートマッチングはよく画像認識に使用されます。これは良品と検査ワークの各画素同士の相関を計算して大きいほど良品と判定する方法です。これらの方法もカテゴリ間の線形分離しかできないため、検査性能には限界があります。

NN方式は、非線形分離が可能なため検査精度が非常に高くなるために期待されました。しかし、学習していないものを正しく認識することができないため、実用できないことがわかりました。なお、当社代表取締役が開発した境界学習型ニューラルネットワークは学習していないカテゴリの誤判定を抑制することに成功し、パターン検査装置として実用化できました(検査精度99.99%以上を達成したものもあります)。

なお、近年ニューラルネットワークが発展しディープラーニング技術が開発されました。この技術のパターン認識性能は従来技術と比較すると圧倒的に高いといえます。ただし、学習データを多数必要とするため個別の問題に適用するよりも汎用的な問題に適用するのが適切ではないかと思います。

標準化変量を使用する検査装置も各種開発されましたが、従来装置では自動判定ができませんでした。StaVaTester方式では独自の類似度を導入することにより自動判定を可能としました。併せて、残りのパターン検査装置の要件も満足することができ、現状では実用性の高い数少ない検査装置となっています。

以上をまとめると、これらの識別技術の識別性能は次表のようになります。

各識別技術の識別性能

識別技術の図解

各識別技術の識別性能を図を使用して説明します。

いま、下図の文字を認識することを例にとります。ただし、学習させるのは「a」と「b」のみとします。

パターン認識模式図

テンプレートマッチングなどの解析的な方法ではカテゴリの境界線は直線になりますから、下図のように曲線で表される場合が多い各カテゴリの境界をうまく表現できません。このため、一定程度の誤判定が必ず生じます(第1種エラー率は十分低くない)。一方で、「c」を「a」または「b」と誤判定する場合もあります(第2種エラー率は十分低くない)。

テンプレートマッチング法による文字範囲1

また、たまたま選択した画像がカバーするカテゴリ範囲がどの程度であるか全くわかりません。実際に使用できるかどうかはかなりの数のパターンに対してチェックしてみるしかありません。

テンプレートマッチング法による文字範囲2

階層型NNはカテゴリ境界線を曲線で表現できます。従って、当該第1種エラー率は低くなります。

一方、カテゴリ「c」に属するパターンは、当該パターンが境界線の「a」側にあれば「a」、「b」側にあれば「b」と判定されがちです。従って、非学習パターンに対する判定はかなり精度が低いことになります。

この原因は、NNはカテゴリ間の境界線を学習する方法であるからといえます。

通常の階層型NNによる文字範囲

そこで、境界学習型NNでは当該カテゴリの境界線を学習するようにしました。このため、第1種エラー率と第2種エラー率が小さくなります。

なお、境界学習型当NNは、当該カテゴリに属するデータを統計解析し、統計的に当該カテゴリの境界に近いデータ(境界データ)を合成し、当該カテゴリデータに対しては出力値が1になるように、境界データに対しては出力値が0になるように学習することによって構築されます。

境界学習型NNによる文字範囲

StaVaTester方式は、境界学習型NNと同様統計処理を使用していることもあり、境界学習型NNと同程度の識別精度があることを確認しています。

まずはお気軽に無料相談・お問合せをご利用ください!

お電話でのお問合せはこちら

086-259-0568

お問合せ・ご相談は、お電話またはフォームにて受け付けております。

メールでのお問合せは24時間受け付けておりますので、まずはお気軽にご連絡ください。

受付時間:9:00~17:00
定休日:土曜・日曜・祝日