絵が苦手な人でも高画質・高品質な画像をテキストから生成することが出来る画像生成Aiですが、なかにはイメージ通りにすることが難しいものもあります。
今回は生成するのにコツが必要な画像とそれを生成する方法を探っていきます。
生成した画像3万枚以上、作ったプロンプトは2万を超える経験と失敗からお伝えします。
今回は無料で使える画像生成Ai Leonardo.Aiで画像を作っていきます。
画像生成Aiが苦手とするもの
画像生成Aiは学習された画像を元に新たな画像を作ることから、学習しにくいもの=普通ありえないものを出力するのは難しいです。
画像生成Aiは学習モデルをもとにして入力されたテキストから画像を生成しています。
学習モデルとは、画像とその説明(テキスト)がセットになった大量のデータに基づき、画像の特徴とテキストを結び付けて扱えるようするものです。
大量のデータの中で一般的な画像を出力するものはイメージに近い画像を生成してくれますが、非現実的な画像を生成しようとすると難易度があがります。
hybirdで非現実的な画像を作る
Hybridの意味
- 生物学で、異なる種類・品種の動物・植物を人工的にかけ合わせてできた交雑種。 「―のバラ」
- 2.複数の方式を組み合わせた工業製品など。 「―車」
hybirdを使って生成しにくい画像を作っていきます。
空中に浮かぶ城
現代の常識では城は空に浮かびません。
この非現実的ですが、世界的には超有名だと思います。
ファンタジーの王道だと思っています。バ〇ス!で有名?なものですね。
テキスト生成Aiで「空中に浮かぶ城」とするとA floating castle、やcastle in the skyでプロンプトを提案してきます。
正直にしたがって、かつ欲張って作ったプロンプトです。
空中に浮かぶことで人が寄り付かず、コケや蔓で覆われた手入れの行き届いていない城を生成したかったのでmoss,vinesを追加しています。
秘境にある放置された城になりました。空には浮いていません。
hybird 組み合わせるプロンプト
空中に浮かぶ城は考え方をかえると空にあるものと組み合わせると考えることが出来ます。
空にあるものの代表格とすると雲(cloud)です。
これからCastle in the skyをCastle cloud hybridに置き換えて生成します。
生成された画像はこちらです。
まだ浮いていません。城の基礎がないような断崖絶壁にある城になっています。
なぜこうなるかというのは既存の学習モデルに紐づいているので苔、蔓などは地上にあるもの、城は地面に建っているものということからこのような結果が出やすくなっています。
どうしたらうまく行くのかというと結論から言います。
今回悪さをしているのはmoss,vinesのプロンプトと地面を描写していることです。
moss,vineはプロンプトから無くします。
ネガティブプロンプトに地面(ground)と地面を草木をイメージさせる緑(green)を追加します。
空中に浮かぶ城が生成されました。
空中に浮いている感が足りないのと、緑に覆われている感じを追加したいところです。
ここから、もう少しイメージに寄せていきます。
Ai Canvasを使います。
今の状態だと山の頂に建つようにも見えるのでもう少し空中感を出していきます。
Edit Canvasで画像をAi Canvasに送ります。
Inpaint/outPaintで城の下の雲の量を減らします。
変更する箇所をマスクしてプロンプトを入力します。
ネガティブプロンプトも忘れずに入力します。
モデルの変更も忘れずに行ってください。
一度、Generateで編集します。
次に地面に草木を増やします。
CanvaModeをSketch2Imageに変えます。
緑色のペンでペイントしてプロンプトを入力して生成します。
草が生えました。これで完成です。
Ai CanvasやSketch2Imageの使い方や出来ることの詳細はこちらで解説しています。
fusion 融合、統合
hybridと同じ効果をもつ言葉でfusionがあります。
fusionの意味は融合、統合◆二つ以上のものを一つに合わせることです。
こちらもハイブリッド同様の効果がありました。
hybridをfusionに置き変えて生成された画像
hybridより宙に浮いている感が出ています。
hybridでうまく行かないときはfusionを試してみる手もあります。
浮遊城の下がとがっているのと砲台らしきものがあるのはこれはあの名作の影響でしょうか・・・。
色々混ぜてみる
hybridとfusionを使うことで非現実的な画像でも生成することが出来るので色々試してみます。
純粋に混ぜるだけなのでイメージと違うものも出てくる可能性があります。
猫と女性を混ぜてみる
発想が単純と言いますか、思い浮かぶものがないのが残念です。固定観念に囚われすぎです。
仲がいいですね~、距離が凄く近いです。猫耳は正直予測はしていました。お気に入りは3番目です。
ひっつき虫のようにくっついてます。どうしてそうなった?と言わんばかりです。
4番目は同化しています。まさに融合してます。
木の精霊を降臨させてみる
これも発想が単純です。ですが色々やっていきましょう。
そうじゃない感が非常に強いです。目力が強い!!
顔の主張が強いですね。実際にみたらマジでビビります。
いい感じです。顔の感じが抑えられてます。
車と人を混ぜてみる
純粋にcar man fusionにしたところ車の前に立つ男性と車の画像が出てきました。
そこで工夫をしてみます。車のパーツと人を組み合わせてみます。
普通のロボットですよね・・・・。タイヤは何処にいった?
まとめ
想像上のものを描く方法としてhybridとfusionについて実際にプロンプトを使ってみました。
うまくイメージ通りにするには何度か試す必要がありますが、情報を整理してプロンプトを組み立てるとうまくイメージ通りのものが出来上がります。
ポイントは次の通りです。
画像生成が上手くいかないときはぜひ試してみてください!
この記事の画像はWebpを使っています。
画像の容量が軽く高画質が特徴でブログやWEBサイトに掲載するのに最適です。
ぜひこちらの記事もご覧ください。
最後までお付き合いいただきありがとうございました。
コメント