Black Forest Labs が FLUX.1 Kontext を発表:高度なコンテキスト認識画像生成と編集

あなたは森にいる鹿の写真を撮りたいと頼みました。そうすると冬にも欲しくなりますよね。それから、帽子をかぶること。ほとんどの生成ツールでは、新しいリクエストを作成するたびに再起動が必要になります。 Black Forest Labs は、そうでないツールのリリースを発表しました。

最近リリースされた生成フローマッチングモデルのスイートである FLUX.1 Kontext では、画像の作成と編集のための高度なコンテキスト認識機能が導入されています。従来のテキストから画像へのシステムとは異なり、FLUX.1 Kontext はユーザーにテキストと参照画像の両方をプロンプトする機会を提供し、より正確で反復的な視覚的変換を可能にします。このモデルは、高速でフォトリアリスティックなレンダリング、強力な即時遵守、最小限の遅延での段階的な編集をサポートしています。

マルチモーダル機能が画像生成を再定義

FLUX.1 Kontext は、テキストと画像の合成と、インタラクティブなローカライズされた画像編集を統合します。コンセプトデザインからクリエイティブな探求に至るまでのユースケースをサポートし、キャラクターの一貫性、ローカル編集、スタイル転送などの機能を提供します。スイートには 2 つの新しいモデルが含まれています:

FLUX.1 Kontext [pro]:反復的な画像編集と修正用に最適化されており、テキストと画像の両方の入力を受け入れ、スタイルと文字の一貫性を維持しながら複数のステップにわたって画像を調整できるようにします。
FLUX.1 Kontext [max]:高いパフォーマンスと速度を実現するように設計されたこのモデルは、出力品質を犠牲にすることなくプロンプトフォローとタイポグラフィを強化します。

どちらのモデルも、KreaAI、OpenArt、TogetterAI などのパートナーを通じて、カスタマイズ可能なオープンウェイトバリアントである FLUX.1 Kontext [dev] を使用してアクセスでき、現在研究者と開発者向けにプライベートベータ版が提供されています。

こちらもご覧ください: テキストから画像への生成を民主化する取り組み

ベンチマーク結果と開発者のプレイグラウンド

パフォーマンス評価では、FLUX.1 Kontext [pro] がテキスト編集や文字保存などのタスクでトップパフォーマンスにランクされています。また、レイテンシでも競合他社を上回っており、生成と編集の両方のワークフローでより高速な結果を提供します。

実験を簡素化するために、Black Forest Labs は、ユーザーが技術的なセットアップを必要とせずに FLUX モデルをテストできるデモ環境である FLUX Playground もリリースしました。プレイグラウンドは、実稼働環境での FLUX を評価するチームのリアルタイムのプロトタイピングと意思決定をサポートします。

モデルは強力な結果をもたらしますが、長時間の複数編集セッションで時折生じる誤解や劣化など、いくつかの制限が残ります。 Black Forest Labs は、将来のアップデートでこれらに対処する予定です。

playground.bfl.ai でプレイグラウンドを探索してください。

Skype は廃止されましたが、ピアツーピア技術は存続しています IoT がリアルタイム業務をどのように変革するか

モノのインターネットテクノロジー