AI が協調フィルタリングで予告編を分析し、映画の観客動員数を予測

新しい機械学習モデルは、予告編に基づいて映画を視聴する可能性が最も高い視聴者を予測します。
協調フィルタリング手法を使用して、顔、物体、風景などのトレーラーの特徴を抽出します。
これらの機能を入場者数や人口統計データと組み合わせて、視聴者の入場者数を予測します。

予告編は、新作映画のマーケティングキャンペーンで最も重要な部分です。登場人物を紹介し、プロットを伝え、ストーリー展開に関するヒントを明らかにし、映画愛好家の間での認識を高めます。

映画製作者にとって、これは観客の視点、つまり何が気に入ったのか、何が印象に残らなかったのかを学ぶ機会となります。通常、これらの詳細は、マーケティングキャンペーンの次の戦略を計画するのに役立ちます。

予告編に最適なプレビューを見つけやすくするために、20 世紀フォックス映画スタジオのエンジニアは、予告編に基づいて映画を視聴する可能性が最も高い視聴者を予測する、Merlin Video という機械学習手法を構築しました。

仕組みは?

Merlin Video は、トレーラーの緻密な表現を生成し、それを使用して視聴者の行動を分析および予測します。研究チームによると、映画スタジオが観客の興味を測定するために予告編の低レベル表現を使用するのはこれが初めてです。

これは、最先端の協調フィルタリングモデルに基づいており、照明、物体、色、顔などの特徴を抽出し、それらを観客動員数や人口統計データと組み合わせて、既存の映画だけでなく、まだ公開されていない映画の観客動員数を正確に予測します。

畳み込みニューラルネットワークは、フレームごとに低レベルの特徴を抽出します。事前トレーニングされたネットワークを使用して、トレーラーの関連フレーム内の特徴を検出および分析できます。これらの特徴の適切な表現を歴史的記録に基づいてトレーニングされたニューラルネットワークに供給することで、映画の予告編の特徴と将来の視聴者の好みとの間の重要な関連性を発見できます。

マーリンビデオの概要 |研究者提供

参照:arXiv:1807.04465

より具体的には、Merlin Video には、距離ベースの協調フィルタリングモデルとユーザーの最新性およびユーザー頻度を結合して、視聴者の出席確率を生成するロジスティック回帰レイヤーが含まれています。システムはエンドツーエンドでトレーニングされ、ロジスティック回帰損失がトレーニング可能なすべてのモジュールに伝播されます。

要約すると、エンジニアはこの調査において 3 つの主な貢献を行いました。

<オル>

予告編のコンテンツを使用したコールドスタートと劇場版の推奨を処理するために特別に開発された映画リリース用の推奨モデル。

彼らは、Merlin Video の複数のバージョンのパフォーマンスを測定し、現実世界のシナリオにおける意思決定手順でそれをどのように活用できるかを実証しました。

ビデオ入力とテキスト入力を組み合わせて予測精度を高める実現可能な方法について話し合いました。

このニューラルネットワークは、過去数年間にリリースされた何百もの予告編と何百万もの入場者数の記録に基づいてトレーニングされています。彼らは、Google Cloud 上の NVIDIA Tesla P100 GPU と CUDA ディープニューラルネットワークを利用した TensorFlow を使用してモデルをトレーニングしました。

読む:Nvidia AI は 30fps ビデオを 240fps に変換できます

今後の作業では、エンジニアは、映画の成功を予測するためにビデオとテキストの両方の機能を利用するモデルの構築に重点を置く予定です。

イッテルビウム:長距離量子ネットワークに革命を起こす AI はクリーンなトレーニングデータを使用せずにノイズの多い画像のノイズを除去します

産業技術