データの好きなところに戻る:AIファブリックを使用した一般的なデータサイエンスの頭痛の種の解決
編集者注: 自動化市場が進化し続けるにつれて、UiPathプラットフォームも更新され、お客様の自動化のニーズに最適に対応できるようになります。そのため、この記事の一部の製品名は、記事が最初に公開されてから進化しています。最新情報については、をご覧ください。 AIセンターのページにアクセス 。
私はデータを扱うのが大好きです。しかし、それは私にいくつかの欲求不満を引き起こしますか?賭けます。
データサイエンティストとして5年以上働いてきた私は、データに対する野心と、データを運用する際の制限とのバランスをとろうとすることに苦痛を感じてきました。たとえば、機械学習(ML)モデルを本番環境に導入するためのリソースがなかったため、好きな会社に辞めました。私たちはデータを使用してタスクを解決するために非常に一生懸命働き、製品に影響を与える機会がなくなってしまいました。仕事が組織的および運用上の課題で行き詰まると、失望しやすくなり、そもそもデータの操作が好きだった理由を見失ってしまう可能性があります。
このブログでは、データサイエンティストの旅についてお話ししたいと思います:
-
データの世界への関心の動機となるもの
-
期待が現実に出会うときに直面する制限
-
データサイエンスをRoboticProcessAutomation(RPA)などのテクノロジーに統合することで、データの運用方法を変える必要がある可能性
-
人工知能(AI)とRPAを統合して、データを最大限に活用するための新しい機会を推進するソリューションであるAIファブリックに熱心に取り組んでいる理由
データを愛するために、私は創造的な問題解決者になるのが好きです。データは創造的な問題解決に力を与えます。
データを使用して困難なタスクに取り組み、人々の生活に影響を与える課題を解決することは、私にとって自然なキャリアパスのように感じました。私が一緒に仕事をしたデータサイエンティストの多くは、データを使用して問題を解決する方法を学ぶために現場に参入しました。私たちは、私たちが持っているデータを理解し、MLアルゴリズムを探索、開発、使用してデータをテストし、構築したモデルで推進する力と洞察を通じて新しいソリューションを実現する方法を見つけることに情熱を注いでいます。
私がデータサイエンティストになることを決心したとき、私はその仕事に伴う課題と起こりうる頭痛の種があることを知っていました。使用するデータの種類に関係なく、必然的に次のようになります。
-
データの処理とクリーニングに時間を費やす
-
モデルがトレーニングされるまでしばらく待ちます
-
さまざまなハイパーパラメータを試すのに時間を費やす
データを扱うほど、組織の範囲内でデータサイエンスがいかに複雑になるかについての認識が高まりました。データサイエンティストであることに関連する現実は、フィールドに参入するための私の当初の動機を覆い隠し始めました。
現実が襲ったとき:期待を設定し、データをエンドツーエンドで管理する
多くの企業が開発へのデータ駆動型アプローチを採用しており、MLを調査するための初期段階にあります。データサイエンティストの役割はまだかなりまれであり、多くの場合、誤解されています。企業内でデータの運用を開始し、データを使用して問題を解決することを進めると、データサイエンティストにはさまざまな課題が発生する可能性があります。
組織がMLでできること、できないことについて期待を設定することは、私たちが多くの時間を費やす1つの領域です。データサイエンティストとしての私たちの役割の性質、時間を集中したい場所、プロジェクトを成功させるために必要なものについて、他の人に教育することが重要です。
もう1つの課題は、データサイエンスの運用が組織内でサイロ化されることが多いという事実です。これにより、データサイエンスプロジェクトが組織に価値をもたらす能力が制限される可能性があります。
MLモデルだけでは何もできず、何もできません。成功するには、他のチームと連携して、より大きなプロジェクトの一部として含める必要があります。
さらに、モデルによってもたらされる投資収益率(ROI)を示すことは非常に難しいことがよくあります。データサイエンティストは、組織内でのMLの役割を主張する困難な戦いに直面することがよくあります。データサイエンティストは、私たちが演じようとしている役割と、影響を与えるために必要なものを主張するために、多くのサイクルを回すことができます。
データ自体に取り組むことは、独自の一連の固有の課題をもたらします。多くの場合、データを理解してモデルを構築するよりも、データセットの収集、統合、クリーニングに多くの時間を費やしています。モデルの継続的インテグレーションおよび継続的デリバリー(CI / CD)パイプラインが社内ですでに構築されていない限り、私たちの時間の多くは、モデルをローカルマシンからステージングおよび本番環境に移行するためのスケーラブルなパイプラインの作成に費やされます。これは私たちの仕事の範囲外であるだけでなく、モデルの構築とテストに向けて私たちが置きたいと思っている時間もかかります。
継続的なモデルの監視も、準備ができていない課題になる可能性があります。時間の経過に伴うデータドリフトを実験しますか?本番環境のデータは、トレーニングに使用したデータと同じですか?出力はまだ制御されていますか?新しいデータを使用すると、モデルはトレーニングセットで作成されたベースモデルと同様に機能しますか? MLモデルをいつ更新する必要がありますか?
私が好きなことに戻るために、私はデータサイエンスをより広範なプロセスと計画に統合することを優先する企業で働く機会を探してきました。今日、私はデータサイエンスを社内で優先するだけでなく、企業がMLモデルを運用および利用して、より良いビジネス成果を推進できるように積極的に取り組んでいる企業で働くことに興奮しています。
AIファブリックで好きなものに戻る
ますます多くの組織がRPAを使用してプロセスを合理化するにつれて、データサイエンティストが新しい方法でデータを運用できるようになる機会が生まれています。
ここUiPathでは、データサイエンスとRPAを統合し、インテリジェントな自動化を使用してビジネスが新しい成果を推進できるようにすることに取り組んでいます。データサイエンスとRPAを組み合わせることで、自動化の世界でデータサイエンティストが日常的に直面する上記の課題の多くを軽減したいと考えています。私たちはAIファブリックでこれらの取り組みを推進しています。
関連記事: HeritageBankがAIとAIファブリックをどのように使用しているか
データサイエンスとRPAは、連携する方が優れていると考えています。データサイエンティストを招き、データとMLを使用してRPA機能を強化するときに何が可能かを概説することにより、データサイエンスをRPAセンターオブエクセレンス(CoE)の不可欠な部分にすることが重要です。
AIファブリックの開発を通じて、組織が自動化プロセス内のステップとしてMLを考えるのを支援することに重点を置いています。ユーザーがMLとRPA開発をよりシームレスに統合できるように支援したいと考えています。 AIファブリックとRPAを使用すると、データサイエンティストは、前処理とデータ収集に重点を置いたツールを使用して、データパイプラインの構築を簡素化できます。モデルを簡単にデプロイし、モデルを監視し、人間とMLモデルを連携させるように設計されたRPAワークフローを採用できます。
データサイエンスをRPAと統合することで、データサイエンティストが構築および展開されたモデルの投資収益率を証明し、データの調査と実際の問題を解決するモデルの改良に大部分の時間を集中できるようにしたいと考えています。
データに集中するための自由度を高めてどうしますか?
個人的な経験から、データサイエンティストがデータを使用して問題を解決し、データサイエンスを既存のプロセスに統合することに集中できるようにすることで、組織の進化と成長の方法が変わる可能性があることを知っています。
私にとって最も重要なのは、顧客がより良い結果を生み出すのを支援することです。 UiPathでの私の役割では、データサイエンスをRPAと統合することで、企業がより複雑なプロセスを自動化する方法を直接見てきました。企業がAIファブリックなどの製品を通じてデータサイエンスをRPA展開に組み込むにつれて、データサイエンティストが一般的なデータ運用の課題から解放されるのを見るのはやりがいがあります。
AIファブリックの詳細を確認するか、インサイダープレビュープログラムにサインアップして、AIファブリックの新製品に早期にアクセスしてください。
自動制御システム