今回の記事では2023年3月に発表されたMidjourneyの新バージョン、V5について、旧モデルと比較しながら徹底解説していきます。
まず、アップデートによる改善点や変更点は以下の通りになります。それぞれについては次の章で詳しく解説していきます。
また、後半では実用的な使い方も紹介しています。「なんとなくMidjourneyがすごいのは知っているけど、使い道が思いつかない」という方は是非チェックしてみてください。
また、「そもそもMidjourneyとは?」から知りたい方は、起業LOGで以前紹介しているのでこちらの記事を是非チェックしてみてください。
このページの目次
Midjourney V5のリリース約2ヶ月後の2023年5月4日にリリースされたMidjourney V5.1は、現在Midjourneyにおいて最も先進的なバージョンで、opinionatedモードという5.1独自の機能が追加されています。
V5.1を使うと、自分の思い描いたイメージをシンプルな言葉で伝えても、きっちりとその通りに画像を生成してくれます。
これは「シンプルプロンプト」の理解力が向上しているためです。
例えば人間なら、脳内で「クルマ」を想像する時、自然と「アスファルト」や「街路樹」などが連想されますよね。これは、単語のコンテクストへの理解力があるためです。
AIにおいてもこのような単語の周辺情報への理解が深まることで徐々に「シンプルプロンプト」でも通じるようになってきています。
V5.1のもう一つの特徴は、画像の鮮明度を高めることで、よりリアルな出力を得られる点。
さらに、リピーティングパターンのような高度な機能もサポートしているので、より複雑なプロンプトを使用したときも安心です。
これは、Midjourneyが自動的にプロンプトを調整して、画像の一貫性を保つというもの。
これにより、短いプロンプトでも高品質な画像が生成できるので、出力結果を予想しやすくなります。
ただ、その反面、自分の創作の自由度が少し制限される可能性があります
もし、"opinionated"モードのデメリットを避けたい場合は、"rawモード"を利用することも可能です。
そうすることで、一貫性の担保は難しくなるものの、表現の自由度は確保できます。
Midjourneyは以前から優れた画像生成AIとして同じ画像生成AIである『Stable Diffusion』と並んで注目されてきましたが、特定の描写が苦手だったり、1度に理解できるプロンプトの量に制限があったりと課題もありました。
この章では、改善点を中心に、旧バージョンとの比較を通してアップデートの内容を解説していきます。
Midjourney V5では、基本的に出力されるすべての画像が旧バージョンより高品質です。
出力の底上げが達成されており、以前から「AIは手を描くのが下手」と言われるほど手の描写は課題とされてきましたが、Midjourney V5では人物の手だけでなく指先や歯並びまでキレイに過不足なく描くことができるようになっています。
【プロンプト】
A detailed close-up of a human hand reaching out to touch a delicate butterfly, with sunlight filtering through the fingers.
【MidjourneyV4(旧バージョン)】
【Midjourney V5】
【プロンプト】
A photorealistic close-up of a smiling woman showing her perfectly aligned white teeth, with the light reflecting off them, highlighting the details and textures of the teeth. V4
【MidjourneyV4(旧バージョン)】
【Midjourney V5】
Midjourney V5では、基本的に出力画像の画質が旧バージョンと比較して平均2倍になっています。
これにより写実的な画像を出力させた場合はホンモノの写真と見分けがつかないほどのクオリティを発揮できます。
こんな絵が描きたい!というのがはっきりしていて、それを一生懸命英語のプロンプトに落とし込んでもいざ生成してみたら「あれ、言ったことめちゃめちゃ無視されてんじゃん!」ってこと、ありますよね。
しかし、V5からはより長いプロンプトの入力への対応力が大幅UPしています。そのため、いままでは単語ごとにカンマで区切って入力していたものが、文法が伴う文章の形で入力できるようになり、より「自然言語の理解力」の上昇を感じさせます。
例えば、これは後の章で紹介するイラストのプロンプトです。このレベルの文章で入力できるようになったのは、より細かい描写をしたいユーザーにとってはかなり嬉しいアップデートでしょう。
以前から起業LOGでも紹介している「Stable Diffusion」と「Midjourney」はどちらも画像生成AIですが、どちらも高品質のイラストを出力できます。
この章では、この2つの特徴を比較してそれぞれの違いをチェックしていきます。
また、Stable Diffusionの解説記事に興味がある方はこちらから是非チェックしてみてください。
Midjourney V5は現在、Midjourneyの有料サブスクユーザーへの限定公開となっており、料金は月払いで10ドル、年払いで月額8ドルです。
この章では、サブスクユーザーへの登録方法から実際に画像生成する部分まで解説していきます。
既にMidjourneyのアカウントを持っている方へ向けた解説となるので、まだアカウントを持っていない方はこちらの過去記事からまずはアカウント登録してみてください。
まずはMidjourneyのホームページから左下にある自分のアカウントの︙ボタンをクリックし「Manage Sub」からプラン設定ページに移動します。
プラン表は上記の通りとなります。主に利用規模によってプランと料金が3種類用意されていますが、Midjourney V5を使うのが目的であれば「Basic」で問題ありません。
あとは他サイトと同様にクレジットカード情報を登録すればアップグレードが完了し、Discordから生成作業に入ると自動的にMidjourney V5がデフォルト設定されています。
Midjourney V5へのアップグレードが完了すると自動的にデフォルト設定され、基本的にはV5を使うことになりますが、あえてV4などの旧バージョンを使うことができます。
手順としては『/settings』コマンドを入力し、利用したいバージョン履歴を選択するだけです。
画像生成AIを使って、すごい画像を作れるのはわかったけど、それができたところで一体何に使えるの?と考える人もいるでしょう。
この章では、そんな方々のために、実践的な使い道を紹介していきます。
普段仕事や学校で日常的に使う人も多い「PowerPoint」などで「人気なテンプレート」などでおすすめされている画像を使ったり、単純に人気のありそうな画像を使ったりする場合はプレゼンのオーディエンスに既視感を与える可能性があります。
また、WEB記事にしても明らかなフリー素材を使ったりすると低品質なアフィリエイト記事のような印象を与えかねません。
とはいえ、いちいちプロンプトを1から考えるとなると、それもそれで時間がかかってしまい、本末転倒です。
そこで活躍するのが『ChatGPT』です。
欲しいイラストのテーマをだいたいでいいのでChatGPTに伝えると、それをMidjourney用のプロンプトとして出力してくれるのでコピペしてそのままイラストを生成できます。
思い通りのイラストを出力させるためには多少の練習は必要だと思いますが、慣れればかなり楽にできるようになるはずです。
ここでは、実際にWEB記事の挿絵を描かせてみようと思います。
まずはChatGPTにその旨を伝えてみます。
次に、これをこのままMidjourneyに投げます。
すると、以下のようなイラストが出力されました。多少拾えていないプロンプトがありますが、挿絵としては十分使えるレベルです。
『SaaSの運用に悩むビジネスマン』と入力しただけでこのレベルのイラストが出てくるのは驚きです。
次は、挿入イラストとしてよくありそうな「難航する会議」をテーマにプロンプトを生成してみます。
今回も、WEB記事挿絵としてはよくありそうなイラストが生成されました。
読者の皆様も、是非ChatGPT×Midjourneyを試してみてください。
ロゴは、挿絵に使うイラストなどとは違い「フリー素材をそのまま使う」というのは少しむずかしいですよね。また、デザイナーにお願いすると決して安くない費用がかかるのも事実です。しかし、Midjourneyも使い方によってはロゴ作成に使えます。
この記事では例として、WEBサイトロゴに使えそうな画像を作成してみました。
また、ロゴ作成のプロンプトはできればChatGPTではなく自力で書くのがおすすめです。
理由としては、ChatGPTに頼ると、どうしても汎用的なデザインが生成されがちなのと、ロゴの細かいこだわりを実現する際に、結局自分で手直しすることになるからです。
【プロンプト①】 minimal logo design of a house, flat, clean, vector, simplicity
【プロンプト②】minimal logo design of a house, using simple geometric shapes or clean lines, flat, clean, artistic, vector, simplicity,
【モチーフ】家
例①
例②
2022年8月にMidjourneyがリリースされてから、Stable Diffusionなど様々な画像生成AIが登場しています。
これらの高性能なAIは、リリース当初は遊び感覚で面白い画像を作ってSNSに投稿する、というのが使い方のボリュームゾーンでしたが、
徐々に他の写真撮影や油絵、ペンタブを用いたイラスト作成などに並ぶ創作活動としてみなされる風潮が醸成されつつあるようです。
特に、MidjourneyやStable Diffusionで生成された画像専門の画像投稿サイトが多くのユーザーを集めたり、画像を生成するためのPromptがそこそこの値段で売買されるなど新たな創作活動における市場は急成長しつつあります。
そんな中で、AI画像生成を本格的な趣味にするためのメソッドとしては以下のようなものがあります。
Twitterなどでも「AIイラスト」と検索すると大量の作例が出てきますが、他にもAIに特化した投稿サイトも数多くあるのでそこに投稿してみるのも良いでしょう。
Amazonでは、既にAI生成の画像を使った写真集などが販売されていますが、商用利用は現在かなりセンシティブなラインなので、あくまで多くの人に自分のイラストを高画質で見てもらうための手段と考えましょう。
Midjourneyでは画像生成のための「/imagine」以外にも様々なコマンドが存在します。機能がシンプルと思われがちなMidjourneyですが、これらのコマンドを駆使することで表現のしやすさや幅が一気に広がるので、是非使いこなして上級者を目指しましょう。
/imagineコマンドは基本的な使い方は記事前半でも紹介しましたが、実は、テキストだけでなく画像をプロンプトに入力する機能もあります。
以下の画像のように、画像のアドレスをプロンプトの頭にもってきて、そこから通常通りのテキストプロンプトを入力すると、アドレスを貼り付けた画像に影響を受けた画像が生成されます。なので、「このニュアンスを表現したい」といった画像が予めある場合は使ってみるのがおすすめです。
MidjourneyではDiscordのルーム内で画像生成するので、自分が練り上げたプロンプトがルームの参加者に丸見えになってしまいます。
ロゴや商用イラストなど、他人にプロンプトを見られたくない場合はおすすめです。ただし、Proプランの限定コマンドなので、利用するにはプランへの加入が必須となります。
こちらは私が記事の執筆用に作成したアカウントなので使用時間は少ないですが、このように「/info」で今までのトータルの利用時間などの情報を確認できます。
今回の記事では、Midjourney V5の特徴、Stable Diffusionとの比較、コマンド一覧などを解説していきました。
更に、Midjourneyを使って高度なイラストを生成する方法をまとめた資料も配布しているので、気になる方は是非チェックしてみてください。