機械学習の謎を解き明かす
機械学習(ML)は、それに慣れていない人には理解できないように思えます。 MLとは何か、そしてそれが製造業者にとって何を意味するのかについての理解の欠如...
機械学習(ML)は、それに慣れていない人には理解できないように思えます。 MLとは何か、そしてそれが製造業にとって何を意味するのかについての理解の欠如は、人類を引き継ぐ準備ができているインテリジェントマシンについての風変わりなアイデアを生み出すことがあります。しかし、MLは基本的に、情報技術(IT)の開発における大きな進歩です。それが機能する方法とその制限は、組織の利益を最大限に活用するためにそれを使用したい人には完全に理解されている必要があります。
MLは、確かに、製造にまだ持っている、または必要としている人がほとんどいない特定の統計およびITスキルの使用を必要とします。しかし、その原理は非常に単純であり、直感的に理解することさえできます。私にとって、MLの変革の可能性を実感するのに役立ったのは、かつてはかなり平凡な言語翻訳オンラインサービス、つまりGoogle翻訳だと思っていたものでした。
簡単に言うと、言語翻訳ソフトウェアは、長い間、プログラミング辞書、文法規則、およびそれらの多数の例外に基づいていました。このアプローチにはかなりの労力が必要です。
「ルールベース」から「データ駆動型」プロセスへ
・新しい方法論は、より単純なアイデアから生まれました。ルールと字句テーブルを最初から定義しようとせず、ソフトウェアにそれらを「発見」させます。すでに翻訳されている何百万ものページが国際機関から収集されています。
・ユーザーが翻訳用のテキストを送信すると、ソフトウェアはそれを基本的な要素にスライスし、翻訳されたページ内で同じ言語で同一または類似の要素を検索します。
・最も可能性の高い翻訳が抽出され、ユーザーに提案されます。
したがって、データで見つかった関連する統計パターンは、変換ルールを置き換えます。入念にプログラムする必要はなく、ソフトウェアによって自動的に「学習」されます。特に、結果として得られる翻訳の品質は通常それと同等であるため、従来のアプローチと比較して、このアプローチのコスト削減の価値を簡単に確認できます。
製造業では、生産性の向上は大幅な品質改善によってさらに複雑になります。自動化プロセスを指定したことのある人なら誰でも、ソフトウェアが本番環境に入ると直面する可能性のあるすべての状況を予測することがどれほど複雑になるかを知っています。これは、機能ドメインの専門家が関与している場合でも同様です。ソフトウェアの機能ルールは、それ自体が限られた数の観測に依存しているという仮定に基づいています。しかし、現実は予想よりもはるかに複雑であることがよくあります。つまり、自動化が最終的に最適ではなくなったり、ソフトウェアに高額な修正が必要になったりします。
一方、機械学習は、ボリュームに関係なく、利用可能なすべてのデータを使用してそれ自体を吸収および開発します。つまり、パターンやユースケースが画像から除外されるリスクは限られています。
人間が引き続き責任を負う必要があります
このマシンは、利用可能なデータの不完全な選択や不適切な意思決定につながるヒューマンインテリジェンスの「認知バイアス」も回避します。
良い例は、銀行が受け取ったローン要求の自動処理です。アルゴリズムは、借り手の重要な情報と償還情報を調べます。次に、借り手のプロファイルとデフォルトリスクとの間にありそうな関係を強調します。新しいローン要求に適用されると、アルゴリズムは、借り手が返済するかどうかを十分と見なされる精度レベルで予測します。これは、偏見や銀行の工作員の気分によって引き起こされる悪い決定のリスクが取り除かれることを意味します。
それでも、人間が最終的な意思決定者であり続けることが重要です。
まず、ソフトウェアが明らかに完璧ではないためです。 それは人間によって作られた設定によって支配されます。たとえば、「誤検知」(デフォルトする借り手にローンが付与される場合)を回避するように最適化されている可能性があるため、特定のローン申請を拒否する傾向があります。したがって、ユーザーはシステムの推奨事項が正当であることを確認し、必要に応じて拒否する必要があります。これにより、システムは新しい基準を学習できるようになり、アルゴリズムは次回同様のプロファイルからアプリケーションを受け入れるようになります。
もう1つの重要な理由は、特に決定が個人の権利に関するものである場合、倫理基準が満たされていることを確認する必要があるのは人間だけであるということです。
データユーバーアレス
危機に瀕している製造プロセスとそれを維持するデータのタイプに適合するアルゴリズムモデルを選択して設定することが不可欠です。自動化のパフォーマンスは、データ品質とトレーニングセットの代表性という、2つの必須事項を満たすことに依存します。つまり、偏りのない観察に基づいてMLを実行すると、自動化がより効率的になります。
MLを成功させるには、データへのアクセスが非常に重要です。最終的には、高度なアルゴリズムで不十分なデータセットを補うことはできないからです。
コンピュータとデジタル化の能力の増大に伴い、より効率的な自動製造プロセスを設計するためにデータ駆動型アプローチを活用することが可能になり、おそらく不可欠になっています。必要な科学的スキルを超えて、これらのソリューションの成功は、関連データの収集と人間によるそれらの操作の監視にあります。機械学習は、恣意的な行動を却下する傾向があります。これらを不適切な過剰一般化に置き換えないようにするのは私たちの責任です。
作成者 Jean-CyrilSchütterlé、Sidetradeの製品およびデータサイエンス担当副社長
自動制御システム