AI画像生成の新星「NovelAI Diffusion V4」が誕生！その全貌を解明

AI画像生成の新たな時代

Anlatan Inc.が手がけるAI支援創作プラットフォーム「NovelAI」が、最新の画像生成モデル「NovelAI Diffusion V4 Full版」を正式にリリースしました。この新モデルは、2023年末に公開されたV4 Curatedプレビュー版から大きく進化し、23万時間以上のコンピューティングリソースを駆使して開発されました。これにより、より高品質で直感的な画像生成が実現しています。

背景と新モデルの概要

現在、アニメーション風の画像生成AIに対する需要は高まっています。それに応える形で「NovelAI Diffusion V4 Full版」は、従来のV3モデルに比べて画質や忠実性が大幅に向上しながら、処理速度はほぼ同じ水準を保っています。ユーザーの意図を正確に反映した画像生成が可能になっているのです。

「NovelAI Diffusion V4 Full版」リリース動画

主な新機能

1. 自然言語によるプロンプト

この新機能により、英語の自然文を使用してシーンを描写できるようになりました。タグを覚えずに直感的な指示ができるため、プロンプトの文脈は512トークンに拡張され、より詳細な指示が可能です。CLIPからT5テキストエンコーダーへの移行により、文章の意図や文脈の理解力が向上しています。この機能は上級ユーザーにも便利で、自然言語と従来のタグを組み合わせることで、より細かな制御が可能になります。

2. マルチキャラクタープロンプト

最大6人の異なるキャラクターを1つの画像に同時に配置できるようになり、複雑なシーンの生成が実現しました。各キャラクターに個別にプロンプトを設定することで、特徴の交差を防ぎ、一貫性を保つことが可能です。また、キャラクター設定をドラッグ＆ドロップでインポートできるため、簡単に共有できます。

3. キャラクターのポジション指定

画像内のキャラクターの位置を自由に指定できる機能も新たに追加され、構図の制御性が向上しました。これにより、意図した場所にキャラクターを正確に配置できます。

4. アクションタグ

アクションタグを用いることで、キャラクター間の相互作用をリアルタイムにコントロールできます。「誰が誰を抱きしめるか」などの関係性を明確に指定することが可能です。このように、画像生成におけるキャラクター同士の関係を精密に制御できる点が特筆すべきポイントです。

5. フォーカスインペイント

画像の特定部分のみを高解像度で再生成するこの機能により、元の画像との調和を保ちながら部分的な修正が可能。これにより、顔や手、小物などの細かい表現が大幅に向上します。

6. 画像品質と忠実度の向上

SDXLのVAEからFlux VAEへと移行したことにより、色彩表現と細部描写は飛躍的に向上しました。計算リソースの最適化により、詳細でシャープな画像生成が実現されたのも大きな進展です。

7. テキストレンダリング

吹き出し内のテキストや画像内のテキストを生成できるようになり、漫画やイラスト制作が進化しました。英語テキストの配置やスタイルも自然言語で指定でき、直感的な操作が可能となっています。

8. ケモノモデル内蔵

「fur dataset」と入力することで、専用モデルの機能が使用可能です。これにより、ファーリーやケモノアートスタイルの生成が従来よりも簡単に行えるようになっています。

今後の展開

近日追加予定の「バイブストランスファー（Vibe Transfer）」機能により、スタイル転送がさらに進化し、より多様な表現が可能になります。

サービス利用について

「NovelAI Diffusion V4 Full版」は、公式サイト(https://novelai.net/)で利用可能です。最新モデルを利用するためには、新しい決済システムへの切り替えが必要です。クレジットカードでの更新には5000 Anlas、PayPalでの更新には2000 Anlasのボーナスがプレゼントされます。