起業ログTOP > IT toCサービス > Stable Diffusionとは?始め方と呪文(Prompt)を徹底解説
最近『誰でもプロ級のイラストが描ける』、『Midjourneyより凄い』など、話題の絶えない『Stable diffusion』。以下の作例にもある通り、建築やインテリア、絵画からキャラクター生成まで、無限の可能性を感じます。
今回の記事ではそんな『Stable diffusion』の始め方から使い方のコツ、更には、独自で作成した作例のPrompt(AIへの命令文)まで公開して徹底解説していきます。
Stable diffusionで作成した建築
Stable diffusionで作成されたキャラクター
今回Stablediffusionで作成したイラストのプロンプトを無料配布しています
このページの目次
Stable diffusionはドイツのミュンヘン大学の研究チームが開発した「Text-to-Image(文字列から画像)」モデルで、要するに流行りの「画像生成AI」です。
コードが一般公開されており、料金も無料で使うことができます。
ただ、使用には8GB以上のメモリを持つPCが推奨されているため、現段階ではStable diffusionを組み込んだアプリなどは別にしてスマホやタブレットで使用するのは難しいでしょう。
主な出資元となる『StabilityAI』
但し、Stable diffusionは学習データにweb上で公開されている膨大な量の画像を使用しており、当然その中には著作権で保護されているものもあるため、研究チームに出資したStability AIには複数の訴訟がされています。
しかし、現状ではStable diffusionで生成された画像には権利は発生しないとし、用途はユーザーの自由となっています。
また、Stablediffusionで画像を生成するための命令文(プロンプト)を生成するための『プロンプトエンジニアリング』という概念が登場するほど『どうすれば良い絵を描かせることができるか?』は重要なテーマとなりつつあります。
なので、もしかしたら今後、『生成した絵には権利が発生しないが、絵を生成するためのプロンプトには著作権が発生する』といった事態になることもありえるかもしれませんね。
この記事では、記事を執筆する上で実際に生成した画像のPromptを無料配布しているので、是非みなさんもこのPromptを元に自分なりのアレンジを加えてみてください。
今回Stablediffusionで作成したイラストのプロンプトを無料配布しています
今回Stable Diffusion の解説記事を書く上で実際にStablediffusionを使っていて思ったことがあります。それは『習うより、慣れろ』です。Stablediffusionに関しては色々とネットで情報を集めるよりもまずは自分でプロンプトを書いてみるのが一番の近道だと思います。
今回は編集部が実際にSlackのチャットボットのプロフィール画像をStablediffusionを使って生成していきたいと思います。
Slackbotのデフォルト画像を変更してみましょう
今回はSlackのbot用の写真なのでオフィスやPCなどのキーワードを入れます。
せっかくなのでアニメ風のキャラクターを生成します。アニメといったらジブリかな?と思いStudio ghibli anime styleを入れました。
【Prompt】studio_ghibli_anime_style style 1girl, sitting,desk, working
さぁ、先程のPromptでできた絵がこちらです。
うーん。超ひどいかと言われるとそうではないものの、まだなにか足りないようです。
ここで、更にクオリティを上げるためにNegative Promptを活用していきます。実際に加えたプロンプトは以下の通りです。
(painting by bad-artist-anime:0.9), (painting by bad-artist:0.9), watermark, text, error, blurry, jpeg artifacts, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, artist name, (worst quality, low quality:1.4), bad anatomy
ここでネガティブプロンプトのコツをネットで調べてみると、いくつか『呪文』と呼ばれる鉄板キーワードがあったのでそちらを追加してみました。
特にpainting by bad-artist-anime:0.9)あたりは知らないと絶対に出て来ないと思うのでここで抑えておきましょう。
このプロンプトで作成すると以下のような画像が出力されました...!
かなりクオリティが上がったように感じます!
先程生成した画像の構図がかなりいい感じなのでここで『seed』を固定します。記事の後半で解説していますがSeedとは簡単にいうと変数みたなものです。今回は途中で何度かプロンプトをいじりながら合計で30枚ほど作成したのでいくつか掲載しておきます。
SlackのプロフィールがStablediffusion生成のカスタマーサポートに進化しました
結論から言うと「何でも」です。ジュール・ベルヌの名言みたいに、Stable diffusionでは命令文さえ考え出せればどんな絵でも描けます。
しかし、現在人気の高いトピックとなっているのは、異世界風の風景や建築、オリジナルのアニメキャラなどです。
Stablediffusionリリース当初話題となった『乗馬する宇宙飛行士』
あり得ないはずの構図がStablediffusionでは写真のようなリアルさとともに実現されています。
今回Stablediffusionで作成したイラストのプロンプトを無料配布しています
Stable diffusionは、アプリやソフトのようにPCにダウンロードしてデスクトップから開いて...というように使うものではありません。
Stable diffusionとはそもそもがPythonというプログラミング言語で記述されたプログラムなので、既に書かれたコードが入ったファイルをダウンロードして自分のPC上で実行させる、といった形で使います。とはいえ、Googleアカウントさえあれば使うことができます。
これはStable diffusionで使う学習済みのデータのことですが、細かいところは気にしなくてOKです。今回は一番メジャーなChilloutmixを使っていきます。
緑色のCodeからDownloadZipをクリックします。
ダウンロードしたフォルダを解凍したら『Chilloutmix.ipynp』というファイルがることを確認してください。但し、まだ開かなくて大丈夫です。
Github:Chilloutmix
Download:Chilloutmix
Google Colaboratoryは、Pythonなどのコードをweb上で実行できる無料サービスです。
Colaboratory へようこそ - Colaboratory - Google
先程解凍したフォルダから見つけた『Chilloutmix.ipynb』をGoogle Colaboratoryの『アップロード』にドラッグ&ドロップします。
Google Colaboratoryの左側にある▶ボタンをクリックしてプログラムを実行します。
PCのスペックにもよりますが処理の終了まで数十秒〜数分かかることがほとんどです。
上記の処理が完了すると最下部に青文字でURLが表示されます。これの『Running on Public URL』という方をクリックするとStablediffusionが起動されて準備完了です。
処理が完了するまで数分かかることがほとんどです。
Stablediffusion WebUI
結論から言うといくつか存在します。
そもそも上記で紹介した方法は繊細な微調整などを加えてホンモノのプロが描いたイラスト並の画像を出力したい方向けといっても良いでしょう。
以下のツールはStablediffusion WEB UIのように細かい調整やプロンプトの深掘りといった技は使えないものの、手軽に『Text-to-Image』を体験することができます。
お絵かきばりぐっとくんは九州大学の学生が開発したツールでStablediffusionのAPIを使ってプロンプトをLINEで入力できるようになっているため気軽に画像生成を楽しめます。
しかし、入力できるのがプロンプトのみなのであまり高度な制作には向かないといえるでしょう。
Stablediffusion Onlineも同じくStablediffusionのAPIを利用して作られたサイトで本家ほどの入力はできないものの、お絵かきばりぐっとくんよりは細かい画像を出力できるイメージです。
本家の始め方を見て『ちょっとハードルが高いかも...』と感じたかたはこうした簡易版を使ってみて『もっと高度な画像を出力したい』と思ったらStablediffusion WEB UIを始めるといった流れでもいいかもしれませんね。
この章ではStablediffusionを使って画像を生成していく上で抑えておきたい専門用語を解説します。
ここにないものありますが、とりあえずはここにある単語の意味さえ理解しておけば困ることはないでしょう。
Stablediffusion専門用語解説
Stablediffusionに絵を描いてもらう上で最も基本となる命令文のことです。最初は漠然とした単語でもいいので描かせたい絵をできるだけ細かく言語化しましょう。
今回の記事ではStablediffusionを使った上級イラストのプロンプトを公開しているので是非コピペして、一気に飛び級して神絵師の仲間入りしちゃいましょう。
逆に、『こういうのはNG』と先に言える場所です。例えば写実的で写真のような画像を出力してほしい場合はここに『Painting』と書いておけば絵画風の画像が出力されることは避けられます。
簡単に言うと、入力されたPromptに対してどのようなアプローチを取るかの型のようですが、具体的にどのサンプリングメソッドがどういった構図に強いなどの方法論はまだわかっていません。
画像生成を実行する上でのフィードバック回数のことで、増やせば増やすほど精密な画像になっていきますが、その分時間がかかります。また、精密になるものの自分の描かせたかったイラストに近くなるわけではないので注意。デフォルトは20。
stablediffusionでは、画像に対してバッチという単位を使います。バッチカウントはそのプロンプトで何回画像を生成するか、バッチサイズは何枚作るかです。同じプロンプトで一気に何枚も画像を作りたい方はバッチサイズを増やすことで何枚も作れます。
生成する画像のサイズです。デフォルトの512×512が最もいい画像が生成できると言われています。
入力されたプロンプトに対してどれくらい忠実に画像を生成するかの数値です。デフォルトの7.0前後が推奨されています。
シード値のことで、-1に設定すると毎回ランダムに画像が生成されます。生成がうまくいったときはそのシード値を固定することで同じような構図を再現できます。
この章ではStablediffusionを使って生成された作例を紹介します。
各作品にはPromptとNegativePromptが見れるようになっているので、似たような画像を生成したいと思った方は是非コピペして使ってみてください。
とはいえ、同じPromptを用いてもその他の条件によって全く同じ画像が生成できるわけではないため、ある程度自力での試行錯誤は必要です。
今回は流行りの『Stablediffusion』の使い方と実際のプロンプトについて解説していきました。
Stablediffusionではプロンプトを固定すればある程度に似たような画像が生成できるので、誰でもプロ級のイラストを一瞬で生成できてしまいます。
しかし、Seedやその他の要素によって微妙にニュアンスが違うなどある程度のガチャ要素もあるのでハマる人はハマっているようです。
是非、みなさんもStablediffusionを使って自分だけの上級イラストを作成してみてくださいね。
Optimize終了【代替ツール8選】と【乗り換え準備リスト】
中小企業がRPAを導入すべき3つの理由!得られる効果と参考事例
RPAツールのシェアを徹底解説!人気ランキングTOP7・市場の今後は
RPA導入の6つの課題と解決策とは?【失敗しないオートメーション化】
データマスキングとは?必要な理由・活用シーン・機能を徹底解説!
データレプリケーションとは?目的とバックアップとの違いや2つの効果
2025年の崖とは?ITシステムが抱える問題と解決策を分かりやすく解説
【無料】現役アフィリエイターが教えるUbersuggestの使い方
Web3とは?初心者向けにわかりやすく要約!【関連用語集付き】
5Gは本当に必要?メリットや4Gとの違いもわかりやすく解説