Data Analysis

データ分析について語ります。

SQCからビッグデータ分析に移行します、は止めた方が。ビッグデータ分析も活用してます、がよろしいかと。

量産工程を担当されている方から、「SQCは止めて、ビッグデータ分析に移行したいです」というご意見を伺うことが多いです。「止めといた方ですよ」と答えます。

それぞれ得手不得手があり、SQCとビッグデータ分析を並行して、もしくはSQCを強化するためにビッグデータを活用する、という姿がよいのではないかと思います。

と、いうことで、それぞれの利点と欠点をざっくりリストアップ。

SQC Statistical Quality Controlの利点と欠点

メリット

  • お手軽 (手動でもできる。システムなくてもできる。お金かからない)
  • 管理できる ※ここがとても重要

デメリット

  • 異常は分かるが原因は?
  • 時間(特性変動)考慮なし
  • ビッグデータ生かせない
    (ビッグデータならでは、は無い。むしろ破綻するもの多数)

機械学習 Machine Learningの利点と欠点

メリット

デメリット

  • 管理はできない(非正規分布)
    ベイズならできなくはない…
  • データ収集は手動は無理
  • データ収集に投資とシステムが必要。維持管理も。ペイするという、ROI思考や合理性発生=一種の導入障壁
  • 非平衡不良もどうにかなる (%以下、ppmとかの極少量の現象扱えなくはない)

  • モデルはメンテがいる (設備課的組織必要。AI扱えるメンバ必要)

深層学習 Deep Learningの利点と欠点

メリット

  • 高精度の予測・補正 (ただブラックBox)
  • よしなにやってくれ、がち

デメリット

  • とにかく大量の良質なデータがいる (収集時間も。工程データの場合は普通は1年以上、1年後にデータ品質の不具合が見つかったら、また更に1年とか…)
  • 未知(今までなかったデータ)には下手すると暴走
  • 何を持って実証・承認できるかは神のみぞ知る
    (恐らく誰も責任取りたがらない、自動運転の事故といっしょ)
  • 機械学習のデメリットは基本ここにも入る】

工程は安定していて未知のデータなんかない、と思っている方、例えば装置の摩耗による変化などは数年のスパンで進行します。で、一度顕著になるとランダムに異常を起こす。ランダムな異常は(規則性を利用する)AIには手に負えないことが多いです。大丈夫でしょうか?
別の例、学習や工程でで0~9までの入力があった、優秀なDL制御モデルがあったとします。ここに、9999の入力が入ってしまったら、いったい何が起こるでしょうか?何も起こらないかもしれませんが、とんでもない加工をしてしまう可能性もありますね。もちろんちゃんと対策すれば問題ないですが、不用意にDLモデルを使う、というのはそういうリスクを伴うということです。

SQC・機械学習・深層学習のベストミックス

AIの結果を工程にフィードバックするなら、機械学習と深層学習。どっちでも大きなリスクは生じますね。AIの介入を工程に行うか否か、が分かれ目です。

いろいろ書きましたが、適材適所、というか、ベストミックスで行きましょう。