データ分析プロジェクト:理論から実践まで
前回のブログ投稿では、データ分析プロジェクトを成功させるための最初の重要な手順について説明しました。
まず、定義されたプロジェクトの目標を達成するには、アイデアプロバイダー(部門)とデータサイエンティストの間の緊密な協力が絶対に必要です。次に、データサイエンティストが始める前に、データの質と量を確認する必要があります。
この投稿では、いくつかの推奨事項を更新します。データ分析プロジェクトは実際にどのように機能しますか?ボッシュの予測モデルをユースケースにどのように適用できますか?
1。データ分析プロジェクトの目標は達成されましたか?
出典:Bosch.IO
プロジェクトの終了時でさえ、プロジェクトが目標を達成できなかったか、完全に達成できなかったことに気付く場合があります。定義されたプロジェクト目標の達成に向けて取り組む際には、考慮すべき点がいくつかあります。ここでいくつかの典型的な間違いを見つけてください:
a。不正確な予測モデル
プロジェクトの最後に、結果(予測モデルなど)が必要な精度を満たしていないこと、または期待される新しい洞察を提供できないことに気付く場合があります。
なぜそうなるのでしょうか?
最初に尋ねる必要がある質問は、モデルの必要な精度がプロジェクトの開始時に定義されているかどうかです。もちろん、これは基本的な前提条件であり、プロジェクトの計画段階からすぐに検討する必要があります。前述のデータの質と量に関連する側面も、データが「より多くの情報を生み出さない」ため、不正確な結果につながる可能性があります。
したがって、プロジェクトの実施が不十分なプロジェクトの結果のせいではないことが明らかになりますが、結果に大きな影響を与える落とし穴が計画段階に存在します。
b。持続不可能なユースケースを長期間追求する
多くの場合、プロジェクトの開始時に、すべての利害関係者は陶酔しています。技術的および商業的目的は有望に聞こえます。 「プロジェクトは成功する必要があります!」
ただし、この文はリスクを隠します。すべての幸福感にもかかわらず、(中間の)結果に関して一定の中立性と懐疑論を維持することが重要です。持続不可能なユースケースを熱心に追求することは、期待した結果を達成することなく、プロジェクトに多くの時間とお金を投資することになる可能性があります。
したがって、プロジェクトの目標を達成するための実現可能性に関して、批判的でオープンマインドで中間結果を分析することが重要です。
警告のサインに注意し、そこに「到達しなければならない」という理由だけで現実的に達成できないプロジェクトの目標を追求しないことを強くお勧めします!
ここで、「失敗を早める」または「変更する」というマントラについて説明します。これは、付加価値や有用な結果を達成することなく、達成不可能な目標を追求して不要なリソースを投資するよりも、迅速に認識または適応する方がよいと述べています。
いくつかのフェーズでサポートを提供します。各フェーズの後、それまでに達成された結果を分析します。これにより、プロセスのさまざまな時点でプロジェクトの目標または基礎となるデータを適応させることが可能になり、リスクが透明で回避可能になります。

2。理論と実践–概念実証(PoC)から運用ユースケースまで
「実験室の条件下」で機能するものすべてが実際に効果的であるとは限りません。残念ながら、これはプロジェクトの最後に私たちが時々引き出さなければならない結論です。ただし、最初にテストする必要があります。
開発された予測モデルは、過去のトレーニングデータに基づく要件に沿って機能しています。次に、それを運用環境に統合します。
この初期段階でも幻滅が始まる可能性があります。予測モデルは、制御システム上で実行され、リアルタイム(ミリ秒の範囲)で予測を行うように設計されています。ただし、この要件は、モデルが開発されたときには不明でした。アルゴリズムは精度に関する高い基準を満たす必要があるため複雑ですが、リソースが限られているため、ターゲットハードウェアに適用できません。
したがって、最初は優れたプロジェクト結果であるように見えたものを、最終的には実際のユースケースに統合することはできません。その理由は、計画段階での欠点です。
CRISP-DM標準に沿ったデータ分析プロジェクトを実施しますが、重要な追加事項が1つあります。それは、お客様の問題を専門家レベルで理解することに特に重点を置いていることです。 (ブログ投稿の質問3:製造業でデータ分析プロジェクトを開始する方法も参照してください。)
これを行うために、初期インサイトフェーズ中に、データ分析エンジニアはお客様の生産プロセスと解決すべき特定の問題について詳しく学びます。彼らはまた、彼らが深い理解を深めることができるように多くの質問をします。このフェーズは、実際のプロセス、問題、およびデータ間の相関関係を確立するための基礎を築くため、プロジェクトの成功にとって非常に重要です。現実の世界でのプロセスと問題を理解していないと、デジタルの世界で解決策を見つけることはできません。
出典:Bosch.IO
出典:Bosch.IO
データ分析プロジェクトを成功させるためのベストプラクティス
データ分析プロジェクトが失敗する理由はたくさんあります。多くの場合、 1つはありません 理由単独;代わりに、問題は個々の側面の合計にあります。
データ分析プロジェクトの準備段階と計画に必要な時間と注意を向けます。主なルールとベストプラクティスを遵守し、それに従うと、プロジェクトを成功させるための道を歩むことになります。
産業技術