絵が苦手な人でも高画質・高品質な画像をテキストから生成することが出来る画像生成Aiですが、なかにはイメージ通りにすることが難しいものもあります。
今回は生成するのにコツが必要な画像とそれを生成する方法を探っていきます。
生成した画像3万枚以上、作ったプロンプトは2万を超える経験と失敗からお伝えします。
今回は無料で使える画像生成Ai Leonardo.Aiで画像を作っていきます。
画像生成Aiが苦手とするもの
画像生成Aiは学習された画像を元に新たな画像を作ることから、学習しにくいもの=普通ありえないものを出力するのは難しいです。
画像生成Aiは学習モデルをもとにして入力されたテキストから画像を生成しています。
学習モデルとは、画像とその説明(テキスト)がセットになった大量のデータに基づき、画像の特徴とテキストを結び付けて扱えるようするものです。
大量のデータの中で一般的な画像を出力するものはイメージに近い画像を生成してくれますが、非現実的な画像を生成しようとすると難易度があがります。
hybirdで非現実的な画像を作る
Hybridの意味
- 生物学で、異なる種類・品種の動物・植物を人工的にかけ合わせてできた交雑種。 「―のバラ」
- 2.複数の方式を組み合わせた工業製品など。 「―車」
hybirdを使って生成しにくい画像を作っていきます。
空中に浮かぶ城
現代の常識では城は空に浮かびません。
この非現実的ですが、世界的には超有名だと思います。
ファンタジーの王道だと思っています。バ〇ス!で有名?なものですね。
テキスト生成Aiで「空中に浮かぶ城」とするとA floating castle、やcastle in the skyでプロンプトを提案してきます。
正直にしたがって、かつ欲張って作ったプロンプトです。
空中に浮かぶことで人が寄り付かず、コケや蔓で覆われた手入れの行き届いていない城を生成したかったのでmoss,vinesを追加しています。
秘境にある放置された城になりました。空には浮いていません。
hybird 組み合わせるプロンプト
空中に浮かぶ城は考え方をかえると空にあるものと組み合わせると考えることが出来ます。
空にあるものの代表格とすると雲(cloud)です。
これからCastle in the skyをCastle cloud hybridに置き換えて生成します。
生成された画像はこちらです。
まだ浮いていません。城の基礎がないような断崖絶壁にある城になっています。
なぜこうなるかというのは既存の学習モデルに紐づいているので苔、蔓などは地上にあるもの、城は地面に建っているものということからこのような結果が出やすくなっています。
どうしたらうまく行くのかというと結論から言います。
今回悪さをしているのはmoss,vinesのプロンプトと地面を描写していることです。
moss,vineはプロンプトから無くします。
ネガティブプロンプトに地面(ground)と地面を草木をイメージさせる緑(green)を追加します。