Google AI は人間のプログラマーを上回るコードを生成
2017 年 5 月、Google Brain チームは AutoML と呼ばれる新しいアプローチを発表しました。これは、子モデル アーキテクチャを開発するためのコントローラー ニューラル ネットワークであり、特定のタスクを実行するようにトレーニングできます。簡単に言うと、独自の AI を生成できる AI です。
使用されるデータセット
Google の研究者は、Penn Treebank や CIFAR-10 などの小規模な学術データセットで AutoML をテストしました。その後、彼らは AutoML にこれまでで最も困難な課題を課すことを決定しました。今回、彼らは COCO オブジェクト検出や ImageNet 画像分類などの大規模なデータセットをテストし、得られた結果は驚くべきものでした。
いくつかの最先端の機械学習アーキテクチャは、学術コンテストで大規模なデータセットを扱うために人間によって開発されています。 「スケーラブルな画像認識のための転送可能なアーキテクチャの学習」において、Google の研究者は AutoML を最も人気のある 2 つの学術データセットである COCO と ImageNet に適用しました。 AutoML をこれらの大規模なデータセットにネイティブに適用すると、望ましい結果が得られるまでに数か月のトレーニングが必要になります。
仕組みは?
AutoML は、強化学習アルゴリズムと進化的アルゴリズムに基づいて構築されています。ただし、ImageNet に適用するために、研究者は大規模なデータセットをより扱いやすいように修正しました –
<オル>これらの変更後、AutoML は CIFAR-10 だけでなく、COCO オブジェクト検出と ImageNet 分類にも最適なレイヤーを見つけることができました。これら 2 つの層が結合されて、NASNet と呼ばれる新しいアーキテクチャが構築されます。 .
図に示すように、NASNet アーキテクチャ (AutoML によって開発) には、通常層と削減層の 2 種類の層が含まれています
出典:Google Research ブログ
結果
NASNet は、ImageNet 画像分類で 82.7% の予測精度を達成しました。これは、Google Brain チームが構築した以前の開始モデルよりもはるかに優れています。また、以前に公開された結果と未公開の結果よりも 1.2% 優れたパフォーマンスを示しました。
NASNet のサイズを変更して、低い計算コストを維持しながら適切な精度を達成する一連のモデルを生成することもできます。たとえば、NASNet の小型バージョンでは 74% の精度が得られます (計算コストは半分に削減されます)。これは、モバイル プラットフォーム用に設計された同じサイズのいくつかの最先端のモデルよりも 3% 以上優れています。
図からわかるように、NASNet の精度は、ImageNet 画像分類のさまざまな数 (数百万単位) の操作とパラメータを含む、さまざまなモデル サイズで人間が発明したモデルよりも高くなります。
この表は、ImageNet 分類におけるアーキテクチャ検索とその他の人が開発したモデルのパフォーマンスを示しています。積和とは、1 つの画像に対する複合積和演算の数を指します。
Faster-RCNN と NASNet を使用した物体検出
Google 研究者は、ImageNet から学習した機能を COCO 物体検出に移しました。テストでは、ImageNet の学習された機能を Faster RCNN フレームワークと統合することで、COCO での以前の予測パフォーマンスが影を落としました。最大のモデルは 43.1% の mAP を達成しました。これは、最先端のモデルの過去の結果よりも約 4% 優れています。
参照:arxiv.org
画像分類の推論と物体検出のための NASNet のソース コードは、Github で入手できます。
次は何ですか?
COCO および ImageNet 上の NASNet によって学習された機能は、いくつかのビジョン アプリで再利用できます。さらに、このアプローチは、特定の種類のニューラル ネットがなぜこれほど優れたパフォーマンスを発揮するのかについて何かを教えることができます。
AutoML は、機械学習の分野を専門家以外にも開放し、AI を活用した高度なマシンやロボットの開発に使用できる可能性があります。研究によると、この知能レベルの AI は視覚障害者の視力回復に役立つ可能性があります。
明らかに、このアーキテクチャは自動運転車に使用できます。また、このシステムが交通、道路上の危険、歩行者の識別に役立つことも想像できます。また、拡張現実でアプリケーションを環境とより適切に対話させるために使用することもできます。しかし、おそらく、この AI の最も興味深い応用例はまだ発見されていません。
読む:15 の高度な人工知能プロジェクト
将来的には、Google 研究チームは、この種のコンピュータ生成アーキテクチャの分析とテストに取り組み、アーキテクチャを改良し、より深く理解する予定です。成功すれば、まったく新しいタイプのニューラル ネットワークを刺激することができ、全員に大きな影響を与えることになります。
産業技術