| AUTOMATIC1111 安定拡散 Web UI | |
|---|---|
| 原作者 | オートマチック1111 |
| 開発者 | AUTOMATIC1111とコミュニティ |
| 初回リリース | 2022年8月22日[1] ( 2022-08-22 ) |
| リポジトリ | github.com/AUTOMATIC1111/stable-diffusion-webui |
| 書かれた | パイソン |
| ライセンス | AGPL-3.0 [2] |
AUTOMATIC1111 Stable Diffusion Web UI(SD WebUI、A1111、またはAutomatic1111 [3])は、オープンソースの 生成型人工知能プログラムであり、ユーザーがテキストプロンプトから画像を生成できるようにします。[4] Stable Diffusionを画像機能の基本モデルとして使用し、出力をカスタマイズするための多数の拡張機能と機能を備えています。[5]
歴史
SD WebUIは、AUTOMATIC1111によって2022年8月22日にGitHubでリリースされました。[1]これは、 Stable Diffusionの最初のリリースから1か月後のことでした。[6]当時、Stable Diffusionはコマンドライン経由でのみ実行できました。[5] SD WebUIは急速に人気が高まり、「拡散モデルをローカルで実行するための最も人気のあるツール」と評されています。[4] [7] SD WebUIは、 ComfyUIと並んで、Stable Diffusionで最も人気のあるユーザーインターフェースの1つです。[8] 2024年2月には、技術評論社からStable DiffusionとSD WebUIの使い方に関する日本語書籍が出版されました。[9] [10] 2024年7月現在、このプロジェクトはGitHubで136,000個のスターを獲得しています。[11]
特徴
SD WebUIは、ユーザーインターフェースにGradioを使用しています。 [12] [13] [14] Stable Diffusionプログラムの各パラメータは、 SD WebUI内のUIインターフェースを介して公開されます。SD WebUIには、低ランク適応、ControlNet、カスタム変分オートエンコーダのサポートなど、Stable Diffusion自体に含まれていない追加のパラメータが含まれています。[12] [13] [15] SD WebUIは、プロンプト重み付け、画像間ベース生成、インペインティング、アウトペインティング、画像スケーリングをサポートしています。[16] DDIM、オイラー、オイラーα、DPM++ 2M Karras、UniPCを含む20を超えるサンプラーをサポートしています。[16] [17]また、ベースのStable Diffusionに対するさまざまな最適化にも使用されます。[5]
安定した拡散 WebUI Forge
Stable Diffusion WebUI Forge ( Forge ) は、 ControlNetとFooocusの作成者でもある Lvmin Zhang によって開始された SD WebUI の注目すべきフォークです。[18] [19] Forgeの最初の目標は、SD WebUI のパフォーマンスと機能を改善し、変更を SD WebUI にアップストリームで戻すことでした。[18] [19] Forgeの最適化の 1 つにより、 VRAMの少ないユーザーがStable Diffusion の一部のバージョンでイメージを高速に生成できるようになりました。[18]これにより、8GB と 6GB の VRAM を持つユーザーの生成速度がそれぞれ 30~45% と 60~75% 向上しました。[18] [19] Forge には、標準の SD WebUI よりも多くのサンプラーのサポートなどの追加機能も含まれています。[20] Forgeの最適化の一部はComfyUIから借用され、その他は Forge チームによって開発されました。[19] 2024年8月、ForgeはBlack Forest Labsが開発したFlux拡散モデルのサポートを追加しましたが、これはまだSD WebUIでサポートされていません。[21]
参照
参考文献
- ^ ab AUTOMATIC1111 (2022年8月22日). 「最初のコミット」. github .
{{cite web}}: CS1 maint: 数値名: 著者リスト (リンク) - ^ AUTOMATIC1111 (2023年1月15日). 「ライセンスファイルの追加」. github . 2024年7月11日閲覧。
{{cite web}}: CS1 maint: 数値名: 著者リスト (リンク) - ^ Brade, Stephen; Wang, Bryan; Sousa, Mauricio; Oore, Sageev; Grossman, Tovi (2023年10月29日). 「Promptify: 大規模言語モデルを用いたインタラクティブなプロンプト探索によるテキスト画像生成」. Proceedings of the 36th Annual ACM Symposium on User Interface Software and Technology . Association for Computing Machinery. pp. 1– 14. arXiv : 2304.09337 . doi :10.1145/3586183.3606725. ISBN 979-8-4007-0132-0。
- ^ ab Mann, Tobias (2024年6月29日). 「Stable DiffusionとAutomatic1111を用いたローカルAI画像生成の分かりやすいガイド」The Register .
- ^ abc Lewis, Nick (2022年9月16日). 「WindowsでGUIを使用してStable Diffusionをローカルで実行する方法」How-To Geek . 2024年7月11日閲覧。
- ^ 「SDXL 1.0の発表」。Stability AI。2023年7月26日。
- ^ Zhu, Andrew (2024). PythonでStable Diffusionを使う: Pythonを活用してStable Diffusionによる高品質AI画像生成を制御・自動化する. Packt Publishing. ISBN 978-1835084311AUTO MATIC1111のStable Diffusion WebUI:これは、
Stable Diffusionを使用して画像やテキストを生成できる、現在最も人気のあるWebベースのアプリケーションかもしれません。GUIインターフェースを備えており、さまざまな設定やパラメータを簡単に試すことができます。
- ^ Hu, Qihan; Xu, Zhenghui; Du, Peng; Zeng, Hao; Ma, Tongqing; Zhao, Youbing; Xie, Hao; Zhang, Peng; Liu, Shuting; Zang, Tongnian; Wang, Xuemei (2024). 「CanFuUI: 拡散モデルとControlNetを用いた反復的な画像生成のためのCanvas中心のWebユーザーインターフェース」 . AI生成コンテンツ. Communications in Computer and Information Science. Vol. 1946. Springer Nature Singapore. pp. 128– 138. doi :10.1007/978-981-99-7587-7_11. ISBN 978-981-99-7586-0現在、
Stable Diffusion で最も人気のあるユーザー インターフェースは、Stable Diffusion WebUI と ComfyUI です。
- ^ 大崎、顕; 水口, 瑛介 (2024 年 3 月 23 日).はじめてでもここまでできる Stable Diffusion画像生成[本格]活用ガイド. ja:技術評論社。ISBN 978-4-297-14083-0。
- ^ あわしろいくや (2024年6月12日)。 「第817回リファレンスを簡単にUbuntuでも安定した普及 WebUIを動作させ、画像を生成する」gihyo.jp(日本語)。 ja:技術評論社。
- ^ AUTOMATIC1111 (2022年8月). 「安定した拡散Web UI」. github .
{{cite web}}: CS1 maint: 数値名: 著者リスト (リンク) - ^ ab Wang, Chenghao; Chung, Jeanhun (2023年6月30日). 「[Stable Diffusion]に基づくAI絵画生成技術の研究」. International Journal of Advanced Smart Convergence . 12 (2): 90– 95. doi :10.7236/IJASC.2023.12.2.90.
Stable Diffusion Web UIは、Gradioライブラリに基づくブラウザインターフェースです。
- ^ ab Kim, Seonuk; Ko, Taeyoung; Kwon, Yousang; Lee, Kyungho (2023年10月9日). 「安定拡散モデルを用いたテキストから画像へのプロンプトエンジニアリングのためのインターフェース設計:人間とAIのインタラクションアプローチ」IASDRカンファレンスシリーズ. doi : 10.21606/iasdr.2023.448 . ISBN 978-1-912294-59-6。
- ^ Hook, Steve (2024年1月10日). 「Stable Diffusion WebUI - AUTOMATIC1111 GUIを使用してSDXLをローカルで実行する」. PCガイド.
- ^ Pocock, Kevin (2023年8月16日). 「安定拡散:VAEの使い方」. PCガイド. 2024年7月11日閲覧。
- ^ ab Phoenix, James; Taylor, Mike (2024). 「AUTOMATIC1111 Web User Interface」.生成AIのためのプロンプトエンジニアリング:将来を見据えた入力と大規模で信頼性の高いAI出力(初版). 北京、ボストン: O'Reilly. ISBN 978-1098153434。
- ^ Zhang, Jing; Jiang, Yan (2023年6月). 「ディープラーニングに基づくバティック柄のスタイル転写技術」. Journal of Fiber Bioengineering and Informatics . 16 (1): 57– 67. doi :10.3993/jfbim02171.
- ^ abcd 西川和久 (2024年2月14日). 「【西川和久の定期コラム】VRAMが少ないGPUで画像生成AIを諦めていた人に。「安定拡散WebUI Forge」登場!PC Watch(日本語)。
- ^ abcd 新清士 (2024年2月26日). 「画像生成AI、安いPCでも高速に衝撃の「安定拡散WebUI Forge」 (1/4)」ASCII.jp(日本語)
- ^ Horsey, Julian (2024年2月14日). 「安定したDiffusion WebUI ForgeはAutomatic 1111およびComfyUIよりも最大75%高速」Geeky Gadgets .
- ^ 田口和裕 (2024年8月18日)。 「話題の画像生成AI「FLUX.1」を安定普及用の「WebUI Forge」で動かしてみました(高速化も試してみました) (1/6)」ASCII.jp(日本語)