画像生成の基本&プロンプトの基本

画像生成を始める前に、サブスクリプションが必要です。

基本

  1. プロンプトを考えます。
  2. お気に入りの画像を選んで、編集、別のバリエーションの生成、品質向上を行います。
  3. テキストプロンプトや生成設定を調整、あるいは画像編集キャンバスを使用して、画像自体を調整します。
  4. 適用できる場合は強度とノイズを調整/ステップ数とプロンプトガイダンス値を調整/テキストプロンプトの再フォーカスを行います。
  5. さまざまな画像解像度で試しましょう。

コツをつかんできたら、より高度な画像生成の手法を試してみましょう。i2iコントロールツールキャンバスの使用、プロンプトミキシングにトライしてみてください。

プロンプトはどのように書けばいいですか?

散文 vs タグ付け:  プロンプトは散文を使用して完全な文章で記述することもできますが、最も効率的な方法は主題の説明にタグを付けていく方法です。入力する度にAIは使い慣れたタグを提案します。それぞれの提案の横にあるバブルの不透明度は、そのタグにAIが精通しているかどうかを示します。

The AI will suggest tags that it knows!

トークンリミット:  コンテキストリミットバーをご覧いただくと、あとどれくらいのスペースをプロンプトに使用できるのかが分かります。AIは特定の数のトークンしか見ることができないので、冗長すぎる説明や、長くタグ付けされた説明は好ましくないかもしれないと覚えておいてください。

Watch the Context Limit bar fill up!

ガチョウの一口ヒント:   プロンプトの入力欄の下にあるバーに注目しよう!テキストプロンプトのコンテキストのサイズが限界に近づくと、徐々にバーが埋まっていくよ。

順番が大事です:  主題とタグの順番を変えてみてください。プロンプトのどこに情報を配置するかによって、結果は大きく変わります。最も重要な情報はプロンプトの前半に置くことをお勧めします。

強調しましょう:  入力したタグをAIが無視しますか?タグを{}で囲んで強化したり[]で弱めたりしてみましょう。そうすることで、AIに本当に注目してほしい情報が他の情報に負けてしまうという問題を解決することができます!

ガチョウの一口ヒント:  いろいろなプロンプトを実験してみることがすごくお勧めだよ。普通に生成をしたり低ステップ数を使ってみたりして、どの単語が目的により適した効果をもたらすかを確認したり、さまざまなタグを組み合わせて、どれが自分の好みに合うか試してみてね!

設定はどうしたらいいですか?

ステップ

ステップは、プロンプトからの最初の作成の後、AIが何回洗練を繰り返すかを定義します。少ない数で素早く生成してイメージの方向性を確認することもできますし、ステップ数を増やしてフルイメージを生成することもできます。ステップ数が多すぎると、逆効果になったり、生成が洗練されなくなったりすることもあります。Anlasを節約したいのであれば、気に入った構図を見つけるまでステップの値を比較的低めに保ち、そこから「品質向上」ボタンを使ってさらに画像の質を上げることもできます。

ガチョウの一口ヒント:  Opusティアのユーザーは、サイズが通常のしきい値以下で、かつ一度に1枚ずつ生成する場合、Anlasを消費せずに28ステップ以下の画像を生成することができるよ。

プロンプトガイダンス

プロンプトガイダンスの値は、AIがプロンプトにどの程度反応し、どの程度自由に解釈できるかを示します。値を大きくすると、AIがテキストプロンプトの全体的な意図に近づくようにすることができますが、高く設定しすぎると悪影響を及ぼす場合があります。
※設定欄が折りたたまれているときは、プロンプトガイダンスの値は [正確度] の下に表示されます。

最終的な生成がどれだけ洗練され、強調されるかについて、プロンプトガイダンスの値により調整されることがあります。ガイダンスの値を低くすると、より絵画的で幻想的かつソフトな表現になる一方で、ガイダンスの数値を高くすると、より詳細でシャープな表現になります。

ガチョウの一口ヒント:プロンプトガイダンスの値を変えると、生成された画像の細部が変化するよ。画像を生成した時にその画像の細部を変更したい場合、シード値をロックしてガイダンスの値を少しずつ増減してみることで、変化があるかどうかを確認することができるんだ。小数点以下の値は手入力すれば大丈夫だよ!

シード値とは何ですか?

シード値は、AIが個々の画像を出力する正確な方法を指定します。各生成には固有のシード値があります。生成された画像の右下にあるシード値をクリックすると、シード値の欄に値をコピーできます。シード値の数字は、ダウンロードした生成画像のファイル名やExifデータにも記載されています。

以前に生成されたシード値をプラグインすることで、AIが同じ方向性で生成するようアシストすることができます。

ガチョウの一口ヒント:  右下に表示されているシード値は、[履歴] で現在選択されている画像の生成に使用されたシード値だよ。同じセッションのそれまでに生成された画像のシード値を再利用したい場合は、履歴でその画像を選択し、シード値をコピーしてね!

品質向上

品質向上は、生成された画像を2回目のプロセスに通し、プロンプトに基づいて改良する機能です。

レベルスライダーは強度とノイズの値を組み合わせたものです。レベルスライダーを使用、または [高度な設定を表示] オプションを選択してそれぞれの値を指定することができます。

強度を高くすると、AIが画像の構図を変えることができます。
強度を低くすると、元の生成画像に近くなります。

ノイズでは、AIに細部を生成させられる一方、値が高すぎると不自然なアーティファクトを生成してしまうかもしれません。

まだプロンプトをどう書けばいいのか分かりません!どうしたらいいですか?

もし、生成した画像の品質が低い場合は、プロンプトに "very aesthetic"(非常に美的)"best quality"(最高の品質)"high quality"(高品質)のタグを追加してみてください。データの品質がより高くなり、出力結果が向上するはずです。

主題

生成の際、最も重点を置きたいことはプロンプトの前半に置かれるべきです。例えば、a sorcerer, a tiny kitten, clashing swords, a book(魔術師、小さな子猫、ぶつかり合う剣、本)など、その画像で主題となるべきものであれば何でも構いません。もし逆に、もっと難解な、意外な結末のある生成をお望みなら、思いつくものを何でも入力してください!

スタイル/フレーミングの手法/作者/制作媒体/時期または時代

close-up, portrait, landscape, wide angle(クローズアップ、ポートレート、横型、広角度)などの、スタイルやフレーミングのタグを追加すると、AIの視野を被写体に集中させることができます。また、画像のスタイルにも影響を与えることができます。

例えば、プロンプトの最初にportrait(ポートレート)を追加することで、より焦点の合ったショットになり、異なる構図とダイナミックさを与えることができます。

portrait of a ...

プロンプトの冒頭で生成対象の数を定義することも可能です。

1girl,
1boy,
1other,

制作媒体

制作媒体タグは、画像に特定の絵画や描画スタイルを示すために使用できます。watercolor (medium) /水彩画 (制作媒体)や copics (medium) /コピック(制作媒体)などのタグを使うと、水彩絵具やコピックペンで描いたようなエフェクトの画像になります。

制作媒体タグの例:  3d (medium)/3D、animated (medium)/アニメ風、watercolor (medium)/水彩画、ink (medium)/インク、pen (medium)/ペン、copics (medium)/コピック、graphite (medium)/グラファイト、watercolor pencil (medium)/水彩色鉛筆、spot color (medium)/スポットカラー、など

ガチョウの一口ヒント:   これらのタグを混ぜてみてね!異なるスタイルを組み合わせたり、珍しいメディアを使ったりして、驚くような結果を出してみよう!

フレーミング

フレーミングタグは、画像内の被写体の視点を調整するために使用できます。例えば、pov(視点)タグを使うと、AIが他のキャラクターの目を通しているかのように画像を構成し、そのキャラクターの手を画像に加えることがよくあります。from below(下から)といったタグを使うと、キャラクターを見上げるようなローアングルの画像になります。

フレーミングタグの例:   atmospheric perspective(空気遠近法)、 dutch angle(ダッチアングル)、 fisheye(魚眼)、 panorama(パノラマ)、 vanishing point(消失点)、 perspective(遠近法)、 pov(視点)、 rotated(回転して)、 sideways(横から)、 upside-down(さかさま)、 from above(上から)、 from behind(後ろから)、 from below(下から)、 full body(全身)、 cowboy shot(カウボーイショット)、 upper body(上半身)

時期と時代

AIに時を表すタグを与えると、その時期や時代の要素を画像に反映させることができます。

時代の例:  1990s (style)/1990年代(スタイル)、1980s (style)/1980年代(スタイル)、1800s(1800年代)、renaissance(ルネサンス期)、rococo(ロココ調)、retro(レトロ調)など

ポップアップ表示されるタグの候補をチェックすることもできます!

NovelAI Diffusion Anime V2モデルは、この目的のために年タグもサポートしています!

対象物フォーカス

AIにフォーカスの種類を指定することで、より鮮明な構図を得ることができます。例えば、AIにピントを合わせてほしい対象物がある場合は、"object focus"(対象物フォーカス)というタグを使用してください。

対象物フォーカスの例:  animal focus(動物にフォーカス)、 eye focus(瞳にフォーカス)、cloud focus(雲にフォーカス)、vehicle focus(乗物にフォーカス)、weapon focus(武器にフォーカス)、soft focus(ソフトフォーカス)など

ガチョウの一口ヒント:  提案タグとして認識されなかったとしても、その用語を含めることを恐れないでね。また、NovelAI Diffusionは散文にも対応しているよ。