ブログ

ComfyUIワークフロー：2026年にモバイルゲームを成長させる無料AIツール

Tenjinニュースレター

Tenjinの機能、新しいコンテンツ、およびモバイルマーケティングスペースの更新について、ご登録をお願いいたします。

メールアドレスを入力(必須)

このフォームを送信することにより、プライバシーポリシーに基づき、Tenjinによる個人データの収集と処理に同意することを確認します。プライバシーポリシー

タラ・マイヤー

2026年2月17日

ComfyUIのワークフロー、オープンソースのAIツール、およびクリエイティブ・パイプラインにおけるメリットに関するガイド

モバイルゲームスタジオで静かな革命が起きており、その波は中国から始まりました。現地のチームはオープンソースAIツールを活用し、人員を増やすことなくユーザー獲得（UA）の規模を10倍に拡大しています。急成長するこれらのチームは、従来の「月単位」ではなく「週単位」で何百もの広告クリエイティブをテストし、これらの無料ツールを使って成長を実現しています。

しかし、世界の市場には大きな格差があります。中国の開発者がオープンソースAIワークフローを磨き続けている一方で、欧米のスタジオはどのサブスクリプションサービスを購入するかについて議論を続けています。

Two & a Half GamersのJakubは次のように予測しています。 「2026年末までに、全UAクリエイティブの約50%がAI要素を含むか、完全にAIによって作成されるでしょう。」 彼はモバイルゲーム業界で10年以上の経験を持ち、システム設計、マネタイズ、世界中のスタジオのユーザー獲得拡大を専門としています。ここ3年間は独立コンサルタントとして、インディースタジオから大手パブリッシャーまで、様々なクライアントにクリエイティブワークフローの最適化アドバイスを提供しています。

現在、私は世界中の多くのゲームスタジオと仕事をしており、ゲーム以外のクライアントにもサービスを提供しています。Duolingoを見ればわかるように、アプリがApp Storeをほぼ支配しており、彼らは私たちの専門知識を求めているのです。

Jakubと彼のチームのユニークな点は、実際の予算を持つ実際のクライアントのために、毎日 ComfyUIワークフローを実装していることです。ComfyUIワークフローや同様のクリエイティブ自動化ツールに投資しているスタジオは、サブスクリプションベースのツールでは複製できない競争上の堀を構築しています。

JakubはTenjinのマーケティングディレクターであるRomanと対談し、オープンソースAIツールを使用してUAとクリエイティブ産出を成長させるための実践的なガイドを共有しました。このガイドは、リクエストやテストのバックログに溺れているUAマネージャー、線形的なコスト増なしにスケールしたいスタジオ創設者、反復作業や燃え尽き症候群に疲れたクリエイティブディレクター、そして予算は限られているがプロフェッショナルなクリエイティブを求めるインディー開発者のために作成されました。

今回のTenjin ROI 101は、実用的なツールを使ってモバイルアプリを成長させたいと願うすべての人のためのエピソードです。

学習内容：

なぜオープンソースツールが「ブラックボックス」ツールに勝るのか
始めるために必要な準備
クリエイティブ自動化ツール比較：ComfyUI vs その他
プロはどのようにComfyUIの「画像→動画」パイプラインを使用しているか
クリエイティブ自動化ツールがチームにもたらす利益
速度と量がモバイルゲームの成功を決定する
クリエイティブ生成からパフォーマンス測定までの全プロセス

なぜオープンソースAIワークフローが「ブラックボックス」ツールに勝るのか

ComfyUIワークフローのチュートリアルと技術的な詳細に入る前に、AIツールに対する西洋と中国のアプローチの根本的な違いを理解する必要があります。西洋のAIツールはサブスクリプションサービスのように月額料金がかかりますが、多くの中国製オープンソースAIツールは初期設定後、実質無料です。

西洋の「ブラックボックス」アプローチ

例： OpenAI, アンソロピック、 Midjourney.

学習曲線が最小限で開始が簡単
クローズドソース、サブスクリプション依存
「プロンプトを入力して結果を出力」するだけで、制御性は極めて低い

西洋の『ブラックボックス』AIツールのアプローチは、繰り返しますが完全に閉じています。ポジティブプロンプト、ネガティブプロンプト、そして非常に限られたカスタマイズしかできないのです。

Jakubによると、これらのトップクラスのUGC動画生成ツールは、多くの場合素晴らしいパフォーマンスを発揮しますが、以下の要件が必要になると手詰まりになります。

何百もの広告バリエーションにわたる一貫したキャラクターデザイン
特定の「フック」のための構図の精密な制御
既存のクリエイティブ制作パイプラインとの統合
予算の予測可能性（生成ごとのコストなし）

グローバル規模で広告クリエイティブを大量制作する場合、これらの「ブラックボックス」ツールの多くは最終的にボトルネックになるとJakubは主張します。これが、特にクリエイティブの反復作業において、彼がオープンソースAIソリューションを推奨する理由です。

中国のオープンソースAIエコシステム

中国のAI戦略は、成功したゲームのModコミュニティを意図的に模倣しています。

中国は現在、これらすべてのオープンソースモデルで市場に溢れさせています。これは『モデルを人々の手に渡すことで、エコシステムを支配する』という彼らの政治政策の一環です。

この戦略は、繁栄する文化とエコシステムを生み出しました：

様々なAIモデルがコミュニティの貢献によって絶えず改善されている
（努力を惜しまなければ）無制限のカスタマイズが可能
サブスクリプション費用なし、必要なのはハードウェア代のみ
ワークフローが独自の優位性となる

Jakubのスカイリムに例える比喩は非常に的確です。

基本的に『Skyrim』のようなものだと想像してください。このゲームは今日でもプレイされており、世界最高のRPGの一つとされています。なぜでしょうか？それには巨大なModコミュニティがあり、ゲームを復活させ、パッチを当て、改善し続けているからです。基本的にこれが彼らのアプローチなのです。

これがモバイルゲームのUAにとって重要な理由

ComfyUIワークフローは、クリエイティブ制作に「Modのマインドセット」をもたらします。チームはコミュニティ内でリミックスを行い、オープンソースAIモデルを使用して、複数のフォーマットにわたって必要なアセットを迅速に生成できます。

オープンソースAI生成は、画像や動画だけに限定されません。基本的に、対応するオープンソースモデルがあれば、あらゆる形態のコンテンツを生成できます……オーディオ、3Dアセット、2Dアセット、2Dスプライト——欲しいものは何でも生成できます。

最終的に、あなたのクリエイティブワークフローは次のように進化します：時間とともに能力が高まる複合成長エンジン、競合他社が容易に複製できない独自のIP（知的財産）の壁、そして経常費用ではなく、価値が増大していく資産。これらは、先見の明があるモバイルゲームスタジオが今投資している主な理由です。

成長のためのツール：ComfyUIのハードウェアとソフトウェア要件

Jakubは、ComfyUIワークフロー（およびCivitAIなどのプラットフォームからのモデル）を使用して自動化されたクリエイティブ制作システムを構築するための実用的なハードウェアと買い物リストを挙げています。

性能の良いコンピュータが必要です。具体的には、8GBから10GBのVRAMを搭載したNVIDIA GPUが最低限必要です。AMDでは動作しません。実験的な形式で動作するかもしれませんが、まずCUDAコア対応のNVIDIA GPUが必要です。それが第一歩です。それがあれば、次にComfyUIが必要です。これもインターネットで簡単に入手できます。

ハードウェアへの投資

クラウドサービスとは異なり、オープンソースAIワークフローツールはローカルで実行されます。これには初期投資が必要ですが、継続的なコストを排除できます。

最低スペック：

GPU： NVIDIA RTX 3060 (12GB VRAM)
メモリ： 16GB
ストレージ： 512GB SSD（モデルとワークフローファイル用）

推奨スペック：

GPU： NVIDIA RTX 4070 または 4080 (16GB+ VRAM)
メモリ： 32GB
ストレージ： 1TB NVMe SSD

ROI計算：

MidJourney サブスクリプション：$60/月 ≒ $720/年
Runway 動画生成：$95/月 ≒ $1,140/年
年間節約総コスト：$1,860
ハードウェア投資回収期間： 6〜16ヶ月

選択する構成にもよりますが、ハードウェアの投資回収期間はおよそ6〜16ヶ月です。1年目が過ぎれば、新たな生成はすべて実質「無料」になります。月額料金、シート料金、生成ごとの料金を支払う必要がなくなるからです。

ソフトウェアスタック（すべて無料）

ComfyUI - コアとなるクリエイティブワークフローソフトウェアフレームワーク
Stable Diffusionモデル - SDXL、SD 1.5、および各種専門モデル
LoRAモデル - キャラクターの一貫性維持、スタイル制御用
ControlNet - 構図の精密な制御を実現
AnimateDiff/動画拡張 - ComfyUIに「画像→動画」機能を提供
顔修復モデル - プロフェッショナルな品質の仕上げを実現

ダウンロードソース

CivitAI - モデルとプリセットワークフローの宝庫
Hugging Face - ベースモデルの入手
GitHub - ComfyUI本体とその各種拡張プラグイン

学習への時間投資

努力ベースなんです。少し努力をすれば、手に入ります。私にだってできます。私はプログラマーではありません。ゲームデザイナーです。エクセルで数学や経済計算はできますが、コーディングはできません。それでも、これら全てを行うことができました。だから、そんなに難しいことではないんです。

Jakubの核心的な洞察は、技術的なスキルそのものよりも、プロセスへの献身と、独自のアセットや広告クリエイティブを作成する意欲にあるということです。

クリエイティブ・オートメーション・ツールの比較：ComfyUI 対代替ツール

機能	ComfyUI	Midjourney	ランウェイ	伝統的な
月額コスト	$0	$60-$120	$95-$600	$5,000-$15,000
セットアップ時間	2～4時間	5分	5分	週
制御レベル	完了	数量限定	中	完了
キャラクターの一貫性	素晴らしい	貧しい	中	素晴らしい
動画生成	はい	いいえ	はい	はい
反復速度	とても速い	速い	中	遅い
学習曲線	急勾配	簡単	簡単	急勾配
最適な用途	大規模なUAチーム	基本概念	動画の仕上げ	ヒーローのアセット

モバイルゲームUAに関する結論

週に50以上のクリエイティブバリエーションを制作するチームにとって、ComfyUIワークフローは間違いなく最良の選択肢です。初期のセットアップへの投資は、長期的には無限の生成能力ときめ細かな制御を維持することで回収され、これはブランディングにとって不可欠です。

私が言いたいのは、将来のチームは独自のツール、独自のデータモデル、データセットを構築し、それらをこれらのオープンソースAIモデルを通じて活用するようになるということです。

ComfyUIチュートリアル：画像から動画へのワークフロー

ここからが、ComfyUIワークフローがUAクリエイティブのスケーリングにおいて真価を発揮する場所です。さらに、プロがすぐに気づく核心的な洞察があります：

動画生成、そしてあらゆる生成の鍵は、画像生成にあります。これらのツールを通じて学ぶ最初のルールです。

なぜ「テキスト→動画」はスケールしないのか

ワークフローは直感的に見えます。プロンプトを入力してすぐに結果を得る……一度きりの作成ならこれで機能するかもしれません。しかし、スケールさせたり、クライアントに類似したオプションを提示しようとすると、大きな問題が発生します。

「多くの場合、人々は単に『テキスト→動画』を行います。画像生成ツールに行き、何かテキストを入力すると、何かが生成されます。それは素晴らしいですが、制御権がありません。それが大きな問題です。見た目、キャラクター、環境、あらゆるものの見た目を制御できないのです。」

月に数十（あるいは数百、数千）のUAクリエイティブをテストする場合、この制御不足は致命的です。A/Bテストで何が機能しているのかを分離できませんし、競争力を維持するために十分な速さで反復作業を行うこともできません。

「画像ファースト」のプロフェッショナルパイプライン

フェーズ1：ベース画像生成

精密なプロンプトエンジニアリング
構図制御のためのControlNet
初期生成バッチ（20-50バリエーション）

フェーズ2：修正・調整

顔修復
手の修正（UGCのリアリズムに不可欠）
背景の強化
品質アップスケーリング

フェーズ3：アニメーション化

ComfyUIによる画像→動画変換
キャラクターの一貫性維持
モーションパラメータの微調整
長さとペースの制御

フェーズ4：ポストプロセス

最終的なカラーグレーディング
テキスト/UIのオーバーレイ
書き出しの最適化

ここが、ComfyUIワークフローがクリエイティブチームとUAチームに真のレバレッジをもたらす場所です。プロはすぐにある原則を内面化します： 動画生成の鍵は画像生成にある、という原則です。

基本的に、対応するオープンソースモデルがあれば、あらゆるモダリティで欲しいものを生成できます。私が見せるComfyUIのプロセスは、言わばその枠組みのようなものです。しかし、オーディオ、3Dアセット、2Dアセットから生成することもできます——とにかく、欲しいものは何でも生成できるのです。

これはComfyUIを単なるクリエイティブツールとしてだけでなく、クリエイティブワークフローのインフラとして位置づけるものです。

キャラクターの見た目、環境のレンダリング、ブランド要素がフレームごとにどう表示されるかを制御できます。月に数百のアセットをA/Bテストし、反復しているチームにとって、これは必須です。

一貫性はブランド構築の鍵です。一貫性を維持できなければ、特定の変数を分離できず、競争力を維持するために十分な速さで動くこともできません。

クリエイティブ自動化ツールがチームにもたらす利益

アウトプットの利点は明らかですが、クリエイティブチームへの影響はさらに重要かもしれません。

クリエイティブ疲労と燃え尽き症候群の回避

従来の方法で大量のクリエイティブを制作することは、チームに影響を与えます。細かい変更や繰り返しの修正はチームの士気とモチベーションを低下させ、クリエイティブ疲労や燃え尽き症候群を引き起こします。

多くのバリエーションをテストする場合、通常、分析により多くの時間と労力が必要となり、残業の原因となります。これらはクリエイティブなアウトプットの質に影響を与え、チームに不健康なプレッシャーを与えます。現在のツールと適切なパイプラインがあれば、これらの影響は回避可能です。

クリエイティブ自動化は、反復的な作業サイクルを排除することでこれらの問題を緩和し、クリエイターが戦略と実行により多くの時間を割けるようにします。また、大量生産とテストを、人的リソースではなく技術レベルに委ねることができます。

将来のチームは、独自のツール、独自のデータモデル、データセットを構築し、それらをこれらのオープンソースAIモデルを通じて活用するようになるでしょう。

Jakubによると、UAチームはピクセルに集中する職人ではなく、ツールビルダーへと進化していくと予想されます。チームはより魅力的で、価値があり、持続可能なコンテンツを作成するように進化します。

新しいパイプラインが競争上の堀を構築する

真の競争優位性は、競合他社が購入できないカスタムクリエイティブパイプラインを構築することから生まれます。スタジオが特定のキャラクターデザインに基づいてLoRAをトレーニングし、ブランドに合ったスタイルモデルを開発し、パフォーマンスの高いクリエイティブ要素のライブラリを整備するために時間を投資するとき、根本的なシフトが起こります。

オープンソースAIワークフローは、単なるツールスタックの中のツールではなく、実際の知的財産となります。

私たちが話しているのは、汎用ツールでは複製できないブランド固有の品質レベルを達成する独自のワークフロー、クリエイティブインフラに直接組み込まれた組織の知識、そして生成するごとに良くなっていく評価される資産についてです。

支払いを止めた瞬間に消えてしまうサブスクリプションサービスとは異なり、これらのカスタムパイプラインは時間とともに価値を複合的に高めます。スタジオの美学的好みを学習し、特定のUA指標に合わせて最適化し、競合他社によるリバースエンジニアリングがますます困難になります。これが、最もスマートなモバイルゲームチームが長期的なツール整備を行っている理由です。

速度と量がモバイルゲームの成功を決定する

この変化を最も明確に示しているのが『King Shot』の事例です。2025年2月にリリースされたこのゲームは、急速にスケールし、1日あたり約150万〜200万ドルの売上を生成しました。このような軌道は、わずか2年前にはほぼ不可能でした。Jakubは次のように説明しています：

『King Shot』は今年最大のゲームです。2月頃にリリースされ、現在は1日あたり約150万、場合によっては200万ドル近くの売上を出しています。

『King Shot』の成功が特啓発的なのは、収益だけではありません。このゲームのUA戦略は、広告では親しみやすいパズルスタイルのゲームプレイ（Steamゲーム『Thronefall』に触発されたもの）を提示し、インストール後、プレイヤーをより深い4Xストラテジー体験へとシームレスに移行させる、洗練された「誘い込み」アプローチに依存しています。

これは従来の意味での欺瞞広告ではなく、強力なリテンション指標を維持しながら、ファネル上部の獲得範囲を劇的に広げる綿密に設計されたファネルです。

これはすべて、この種の誘い込み、偽の広告、偽のオンボーディング、リアルなゲームプレイ、4Xスタイルの手法に基づいています……非常にアプローチしやすいため、ファネルを非常に広げることができます。

その巧みさは実行にあります。ユーザーは広告で魅力的なパズルメカニクスを見、最初のオンボーディングで同じメカニクスを体験し、進行するにつれて徐々にゲームのより複雑な4Xシステムを発見します。「偽の広告」と「リアルなゲームプレイ」は十分に整合性が取れているため、ユーザーの信頼は維持され、アクセスしやすいエントリーポイントは、従来の4Xストラテジーゲームを検討しなかったであろう層を獲得します。

しかし、ComfyUIワークフローやクリエイティブ自動化ツールが不可欠である理由を説明する重要な洞察があります： この戦略は、膨大なクリエイティブ量があって初めて機能するのです。

『King Shot』は5つや10個の広告クリエイティブを実行しているわけではありません。わずかに異なるオーディエンスセグメント、クリエイティブフック、メッセージングの角度をターゲットにした数百のバリエーションを同時にテストしています。週単位や月単位ではなく、毎日勝利したコンセプトに対して反復作業を行っています。

この量依存のアプローチは、現在複数のモバイルゲームジャンルに広がっています。ソーシャルカジノゲームも同様の戦略を採用しており、パズルゲームでも使用されています。従来のRPGやストラテジータイトルも、コアなゲームプレイのアイデンティティを損なうことなく、クリエイティブファーストのUAが獲得ファネルをどのように広げられるかを模索しています。

これは、自動化されたクリエイティブ制作がもはや「あれば嬉しい」最適化ではなく、2026年の競争力のあるUAにおける「必須条件（テーブルステークス）」になったことを意味します。週に数百のクリエイティブバリエーションを生成、テスト、反復できるスタジオは、従来の制作スケジュールに依存しているスタジオに対して乗り越えられない優位性を築いています。競合他社があなたが5つのクリエイティブコンセプトを制作する時間に50の新しいコンセプトをテストできる場合、彼らは単に速く動いているだけでなく、オーディエンスの共感、パフォーマンスを駆動するフック、クリエイティブファネルの各段階を最適化する方法について指数関数的により多くのことを学んでいるのです。

クリエイティブ生成からパフォーマンス測定までの全プロセス

ComfyUIのようなオープンソースAIツールを用いたJakubの取り組みは、モバイルゲームのクリエイティブチームの構造的変革のための単なる技術ロードマップ以上のものを表しています。数百のクリエイティブバリエーションを生成しても、パフォーマンスを測定する正確なアトリビューションがなければ意味がありません。

先行するスタジオは、AIパイプラインをTenjinのようなモバイル測定プラットフォームと直接統合し、以下を測定しています：

クリエイティブレベルのROAS：ファイル命名規則によるクリエイティブIDタグ付けと詳細なアトリビューションを使用
コンバージョン率：クリエイティブレベルのデータでセグメント化されたインストールからクリックへのコンバージョン率
コホート分析： Metaなどの大規模プラットフォームでのクリエイティブパフォーマンスを洗練させるために使用
LTV軌道： AI生成クリエイティブと従来のクリエイティブのライフタイムバリュー軌道

これらの測定は、特定のクリエイティブモデルの組み合わせと戦略がリターンをもたらすかを示します。

これらのツールを使って成長するには、正確なアトリビューションも必要です。オープンソースAIワークフローインフラへの投資は、クリエイティブ制作とパフォーマンス結果の間のループを提供できるモバイル測定パートナーとペアになったときにのみ、価値をもたらします。

全文をお読みください。

この動画では、以下の内容を取り上げます：

• 🇨🇳 欧米と中国におけるAIの導入状況およびオープンソースモデルの違い。.

• 🖥️ 必要なハードウェアとソフトウェア（GPUの要件およびComfyUI）。.

• 🎨 「ディテラー」や具体的なレンダリング技法など、画像生成のワークフローをライブで解説。.

オープンソースのAIを活用したモバイルゲームのユーザー獲得

ローマン：みなさん、こんにちは。「ROI 101」の新たなエピソードへようこそ。Tenjinのローマンです。今日は、Two and a Half Gamersのヤクブさんをお迎えしています。こんにちは、ヤクブさん！

ヤクブ：こんにちは。ありがとうございます。ご招待いただき、ありがとうございます。ご存じない方のために申し上げますと、私は「Two and a Half Gamers」のヤクブです。.

ローマン：ヤコブ、そこでどんな仕事をしているの？　あなたのことを知らない人のために、ごく簡単に自己紹介をお願いします。.

ヤクブ：そう、今やゲーム業界、主にモバイルゲーム業界で10年以上働いています。ここ3年ほどは、ほぼ独立系コンサルタントとして活動しています。もちろん、フェリックスやマッテオと一緒に『Two and a Half Gamers』というポッドキャストも運営していて、来月で4年になります。結構長いですね。.

ローマン：すごく長く感じるよ、相棒。本当に長く感じる。君はどう感じてるかわからないけど。.

ヤクブ：うん、うん、うん。そこがまさに骨の折れるところだよね。でも、そう、僕は世界中の複数のゲームスタジオと仕事をしているし、最近はゲーム業界以外の人たちとも仕事をしているんだ。というのも、Duolingoの成功――アプリがApp Storeを席巻している状況――を受けて、みんな僕たちのノウハウを求めているからね。そして、多くの場合、それは完璧なマッチなんだ。だって、彼らには進行システムや収益化、それにシステム設計といった、そういった要素が必要なんだから。.

ローマン：うん、うん。アプリでも同じような現象が見られるよね――本当に膨大な数だ。まあ、とにかく、Modictumでヤクブと会って、AIについて話そうと決めたんだ。もちろん、まだ2025年だから、AIについて話さなきゃいけないよね。.

ヤクブ、さっそく始めましょう。流れに任せて進めていきます。特に議題はありません。ヤクブが何を披露してくれるか見て、私がたくさん質問していきます。.

ヤクブ：うん、うん。話題はたくさんあるけど、まあ、これはできるだけ実践的な内容になるといいな。だって、「AIが仕事を奪う」「AIはこうなる」「AIはああなる」といった、よくある議論にはならないはずだからね。むしろ、「今、完全に無料で何ができるか」という内容で、しかもその効果は絶大です。それでは、そこから始めましょう。.

ヤクブ：さて、そうですね、聴いている皆さんには、最良のケースとしては、YouTubeかどこかでこれを見ていただくのがいいと思います。というのも、これから画面を共有する予定ですし、これからはこれが一種のワークフローになると思いますから。.

さて、この素敵な画像については後ほど詳しくご紹介しますが、その前に、現在市場を完全に席巻している実際の事例、つまり基本的にはAIによるクリエイティブ作品について、いくつか見ていきましょう。.

AIクリエイティブは、市場で見られるAIの、いわば最も表面的な側面でありながら、実際には最も影響力の大きいものです。これは現在の状況において最も重要な要素の一つです。というのも、今年、そして来年はさらに、ユーザー獲得（UA）が製品そのものよりも重要になるからです。.

数年前はこんな状況ではなかったが、今はこうなっている。最も良い例を挙げるとすれば、『King Shot』を見ればよい。『King Shot』は今年最大のゲームだ。2月頃にリリースされ、現在は1日あたり150万、ほぼ200万という数字を記録している。.

そして、そのすべては、こうした「おとり商法」的な偽の広告や偽のオンボーディング、実際のゲームプレイ、4Xスタイルの要素に基づいており、その内容は実際にはSteamで配信されていたゲーム『Thronefall』から流用されたものです。.

（ほらね。）あれは本当に素晴らしかったけど、やはりとても親しみやすかった。.

しかし実際には、アクセスしやすすぎるため、基本的にファネルが極端に広がってしまうのです。ユーザーはこうした偽の広告を目にすることになります。そしてゲームに入ると、広告と同じゲームプレイが展開されるため、偽の広告と偽のオンボーディングが互いに相殺されてしまうような状態になるのです。したがって、もはや偽物は存在せず、まさに広告で見た通りのものになります。しかし、徐々にゲームは、4Xや、私たちがよく目にするような他の高LTV（顧客生涯価値）モデルへとユーザーを誘導していくのです。.

この手口は、ソーシャルカジノといった他のジャンルにも広がっています。このチャンネルの次回エピソードが公開されたら、ぜひご覧ください。そこでも、この「おとり商法」がどのように機能しているかがわかるはずです。.

そして、これらすべてが実現できるのは、やはりクリエイティブとマーケティングがこの仕組み全体の鍵となっているからです。AIを活用したクリエイティブについては――AIなしではできないと言っているわけではありませんが――それが非常に大きな後押しとなり、繰り返しになりますが、量を生み出してくれるのです。というのも、この仕組みには量が必要だからです。.

そして、最近のAIクリエイティブは極めて普及しています。私たちの予測では、2026年末までに、すべてのUAクリエイティブのうち、AIによる「フック」が組み込まれているものや、完全にAIによって作成されたものが、約50%に達すると考えています。例えば、こちらをご覧ください。先ほどお見せしたものは、実際には「フック」のようなもので、実際のゲームプレイ映像などが含まれていました。これに対し、こちらは完全に生成されたクリエイティブで、ご覧の通り、画像や動画エディタで完全に生成されたものを、そのままクリエイティブとして公開するだけで、基本的にはそれだけです。.

ですから、繰り返しになりますが、「AIが仕事を奪う」「AIがこうする」といった話には触れません。文字通り、現在市場でトレンドとなっているもの、そしてそれをどう取り入れるかについてお話しします。つまり、クリエイティブチームがAIを活用していないなら、すでに遅れをとっているということです。現状は基本的にそういうことです。.

では、実際にどうやってそこにたどり着くのでしょうか？　そして、こうしたことはどのように行われるのでしょうか？　あと、生成に関するもう少し具体的な部分についても教えていただけますか？

というのも、先ほども言ったように、最近はAIに関する他のユースケースについては触れないつもりです。なぜなら、私の考えでは、UAパイプラインを習得し、これをマスターしてトラフィックを増やすことが鍵だからです。.

もちろん、こんなものもあります――まあ、あくまで一例ですが。YouTubeで見つけた例を挙げると、今日私が使っている「ComfyUI」のようなツールを使って、3Dアセットを生成することができます。繰り返しになりますが、オープンソースのAI生成は画像や動画だけに限定されているわけではありません。基本的に、そのためのオープンソースモデルさえあれば、どんな形式でも、好きなものを生成できます。これからお見せするComfyUIは、いわばそのための「枠組み」のようなものです。オーディオ、3Dアセット、2Dアセット、2Dスプライトなど、基本的に何でも生成可能です。先ほども述べたように、グラフィックカードが処理できる限り、完全に無料で利用できます。.

つまり、そういうことなんです。だから、「ああ、これはただの画像や動画で、私たちには役に立たないだろう」なんて安易に考えないでください。私たちはほぼ何でもできるんです。なぜなら、将来のチームは、すべてこれをカスタマイズしていく方向に進んでいくと思うからです。というのも、これが、いわゆる「ブラックボックス型AIツール」という西洋式のアプローチとの最大の違いだからです。それら（ツール）は、繰り返しになりますが、完全に閉鎖的なもので――例えば、ポジティブプロンプトやネガティブプロンプトといった限られた操作しかできず、ごくわずかなカスタマイズしかできない――のに対し、実際に今日私たちが何ができるかを見てみると……ええ、実際に何ができるか、何を作り出せるか、検証できるかといった点において、その可能性は非常に多岐にわたるのです。.

これにより、比類のない自由度が得られます。そして先ほども述べたように、私が言いたいのは、将来のチームは独自のツールやデータモデル、古いデータセットを構築し、それらをオープンソースのAIモデルを通じてほぼそのまま活用していくようになる、ということです。なぜなら、それが中国のアプローチ、あるいはそのように扱っている方法だからです。.

例えば、中国は現在、こうしたオープンソースモデルを市場に大量に投入していますが、それは「これらのモデルを国民の手に渡す。そうすることで、エコシステムを掌握する」という政治的な方針に基づいているからです。これに対し、欧米のアプローチは、「OpenAIのような巨大企業があらゆる面で最高の成果を上げている」というものです。しかし、繰り返しになりますが、中国ほど支援的ではありません。.

中国でも、コミュニティがこうしたモデルを牽引しています。というのも、コミュニティがさまざまな追加要素やコンテンツを盛り込んでいるからです。基本的には『スカイリム』のようなものだと想像してみてください。『スカイリム』は今でもプレイされており、世界最高のRPGの一つです。なぜでしょうか？それは、このゲームを蘇らせ、パッチを当て、改良し続ける巨大なMODコミュニティが存在するからです。つまり、彼らのアプローチは基本的にそういうものなのです。.

ローマン：…僕たちが始めた頃の、君の最初のクリエイティブ作品だね。そこに漢字が使われてたんだけど、僕もそのチャンネルをフォローしてるから、君のフォロワーには中国の人たちがいて、彼らがとんでもないことをシェアしてるってことは知ってるよ。.

そこで、最初の質問ですが、このAIの導入に関して、他社に比べて御社の方が率直だと感じますか？　まあ、明らかに「はい」とおっしゃっているわけですよね？

ヤクブ：そう思いますね。彼らのモデルは――繰り返しになりますが、オープンソースなので、自由にカスタマイズして自分用に活用できます――だけでなく、そのアプローチやパイプラインも、やはり中国では異なるのです。.

というのも、繰り返しになりますが、これこそが欧米と中国における大きな違いだからです。中国では、ユーザー獲得がモバイルゲーム業界において最も重要な仕事ですが、欧米ではそうではありません。.

欧米では、通常、それは「プロダクト」です。プロダクト――つまり、デザインや、いわゆるライブオペレーション、プロダクトマネジメント、収益化といった分野のことです。それが最も重要な部分であり、中核となるものです。彼ら［中国］にとってのユーザー獲得は、先ほども言った通り、やはり最も重要な部分です。というのも、現地の業界全体で製品のレベルが非常に高いからです。つまり、そもそも彼らの製品は素晴らしいのです。まあ、それはまた別の機会に議論することにしましょう。.

ローマン：でも、西側の人たちは、こういう――つまり、あなたが言ったように、モデルがオープンソースであるような――ものを採用できるのでしょうか？

ヤクブ：そうね。繰り返しになるけど、できるよ。ほら、今やAIは至る所にあるから、使い方をさえ知っていれば、基本的に言語の壁なんてないんだ。ただ、それは人工的なものなんだ。つまり、努力次第ってことさ。ちょっと努力すれば、できるようになるんだよ。.

でも、それ以外は、まあ、結構簡単だよ。僕でもできるし。僕はプログラマーじゃないんだ。ゲームデザイナーなんだ。数学や経済のエクセルシートなら扱えるけど、コーディングはできない。でも、これら全部できたよ。だから、そんなに難しくないんだ。うん、誰でもできるよ。.

そして、これもまた、西洋の人たちが自分たちの可能性を過小評価しているだけで、本来ならこうした取り組みを至る所で進めるべきなのに。まあ、いずれ取り組んでいくことになるでしょう。.

というわけで、先ほども言ったように、こうしたクリエイティブ作品をどう作るか、そしてそもそもこうしたものにどうたどり着くか、という問題です。というのも、繰り返しになりますが、Nano BananaやChat GPT、あるいは欧米の他の画像生成ツールを使えば、今でもかなり簡単にこれを実現できるからです。それでも素晴らしい作品を作れるんです。誤解しないでくださいね。.

これは、できることや作成できるものの幅が広い分、よりハードコアで、いわばカスタマイズ性の高いものです。例えば、独自のLoRAを作成することも可能です。その意味については、後ほど詳しく説明します。要するに、自分のアート作品やオリジナルの画像、あるいは好きなものを用いて独自のデータセットを作成し、それをモデルに追加するということです。その結果、モデルはまるでそのアーティストが制作したかのようなアート作品を生成するようになります。これは、GPTや他のツールでは実現できないことです。.

というのも、現時点では、私の見るところ、例えば、あらゆる大企業――つまり、例えば、うーん、ブリザードやCD Projekt Red、その他多くの企業といったところですが――おそらくすでに独自のモデルを作成しているでしょう。それらは完全に自社データのみで学習されており、つまり、彼らが突然作成・活用できるようになる「アーティストの軍団」を、法的に全く問題なく作り上げているのです。というのも、現時点では著作権が存在しない上、彼らが利用しているのはモデルそのものであって、トレーニングデータではないからです。まあ、これもまた、そういうことの一つですね。.

さて、どんな感じなのか、何があるのでしょうか？これがComfyUIです。難しい部分に入る前に、まずは少し簡単なワークフローから始めてみましょう。繰り返しになりますが、これはとても簡単です。使い始めれば、視覚的なプロンプト操作がわかります。まずはHugging Faceからツールをダウンロードするだけです。Hugging Faceは、あらゆるデータベースやモデルなどが揃った大規模なプログラマー向けリポジトリです。これらはすべてインターネット上でオープンソースとして公開されています。.

そして重要なのは――「うわ、これってすごく……どうやって作ったの？」なんて思うかもしれないけど、そんなこと考えなくていい。そんな必要はないんです。すごく簡単なんです。だって、ここにあるもの、例えば私が使っているこれらのワークフローなんて、全部誰かからそのまま持ってくるだけですから。.

例えば、もしあなたがハードコアなユーザーなら、文字通り「よし、ノードを追加して、ここにスパゲッティみたいなエッジを張り巡らせて、このビジュアルコーディングをやろう」って感じで、ここから、ここから、ここから、ってやっていけるんです。自分でやることもできますが、私はやりません。だって、例えば、ここに置いてあるこれ――この大きなやつ――ええ、私には到底無理ですから。.

でも、繰り返しになりますが、やることはこうです。インターネットにアクセスして、ガイドを読みます。そのガイドには、ほぼすべてが網羅されています。そして、これもまた、誰かがあなたのためにまとめてくれたものです。だから、怖がらないで――ちょっと見やすくするために、これを消しておきましょうか。怖がったり、「うわ、これひどすぎる」なんて思ったりしないでください。さっきも言ったように、私もこれらをすべて経験しました。私も最初はこれについて何も知らなかったんですが、試行錯誤を繰り返せば、意外とすぐにコツをつかめるものです。そんなに難しくありません。.

そして、これらのツールを使う際の私の最大のアドバイスは、どんなエラーや問題があっても、それをChatGPTに投げ込めば、ChatGPTが「こうすべき、ああすべき、これをすべき」といったように、平易な言葉で教えてくれるということです。これは本当に素晴らしいことです。なぜなら、私たちには今や、文字通りすぐそばの隅にいて、何でも質問すれば何でもやってくれるAIがいるということを、改めて認識する必要があるからです。.

だから、「これがわからない」「あれがわからない」といったことは、すべてどうでもいいんです。繰り返しになりますが、AIに投げ込めば、AIが教えてくれるからです。特にプログラミングコードの場合、即座にエラーを修正し、必要な処理を行ってくれます。つまり、繰り返しになりますが、これは「労力」という障壁だけであって、それ以外の障壁は一切ないのです。.

では、基本から見ていきましょう……

ローマン：じゃあ、ちょっと確認させてください。たぶん、小さい方のことだと思いますが。これは、画面の下部に表示されているクリエイティブのうちの1つを作成するために使われたものですか？

ヤクブ：うん、うん。じゃあ、これについて話そう。これってどうやって使うの？どうやって生成するの？

例えば、これの場合――これは静止画でしたが、その画像を動画生成ツールに通してアニメーション化し、それを1本の動画、つまりクリエイティブ作品としてつなぎ合わせるわけです。こうしたカットの切り替えはすべて、通常、別の画像と別の生成工程を意味するからです。ですから、これらを実現するためには――例えば、このケースでは、もう少し高度なワークフローが必要になります。というのも、ここには一貫したキャラクターが登場するからです。これは、まあ、日常的に目にするようなものではありませんからね。.

というわけで、これにはComfyUIを使います。ComfyUIには、キャラクターの一貫性を保つためのワークフローが用意されています。文字通り、キャラクターを作成し、その時点から「これが私のキャラクターだ」という感じで保存していくのです。そうすれば、その後のすべての生成処理がそのキャラクターに基づいて行われます。その結果、このように、「よし、このキャラクターに夕方のオフィスで座ってもらおう」と指示するだけで、すぐに完成するのです。.

そして、動画生成ツールはあくまで「おまけ」のようなものです。それほど難しいことではありません。いわゆる「クリエイティブな動画生成」において重要なのは、実は画像そのものです。というのも、普段行っているワークフローは「画像から動画」であり、「テキストから動画」ではないからです。.

多くの場合、人々は単に「テキストから動画」という方法をとっています。つまり、画像生成ツールにアクセスして、何か操作をしてテキストを入力するだけで、何かが生成されるわけです。これは素晴らしいことですが、自分ではコントロールできません。そこが大きな問題なのです。見た目の仕上がりや、登場人物の見た目、背景など、あらゆる要素を自分でコントロールできないのです。.

つまり、繰り返しになりますが、動画生成に限らず、あらゆる生成において重要なのは画像生成です。これが、こうした技術について学ぶ上で最も重要なルールです。.

したがって、優れたクリエイティブを作りたいのであれば、まずは画像生成をマスターする必要があります。画像生成をマスターすれば、常に最初のフレームは自分の画像から始まり、その画像をもとにクリエイティブを作成していくことになるため、ほぼ何でも自由に表現できるようになります。.

では、どのようにして画像生成を行うのでしょうか？先ほども述べたように、ComfyUIのようなツールをインストールします。Nano Bananaなど、何でも構いません。ただ、この方法の方が制御性が格段に優れています。それでは、この非常にシンプルなワークフローと、その仕組み、そしてここにあるものについて見ていきましょう。.

さて、これが「Z Image Turbo」です。これはアリババの最新モデルで、ここ1ヶ月で文字通りインターネットを席巻しています。ご存じない方のために説明すると、これは非常に小規模なモデル――文字通りパラメータ数が61億程度――でありながら、その性能が際立って優れているため、前代未聞の存在なのです。さて、それでは手短に説明していきます。.

例えば、ここにあるのは量子化されたベースモデルです。「量子化」とは、これらのモデル（その一部）を実行するために、必ずしも最高級のグラフィックカードが必要ではないということです。そのため、コミュニティがこれらのモデルの軽量版を作成し、VRAMの要件を削減すると同時に、画質も若干低下させています。つまり、このモデルのベースバージョンには16GBのVRAMが必要ですが、12GBのVRAMを搭載した私の3080 Ti GPUグラフィックカードでも実行できるということです。.

つまり、文字通りインターネットにアクセスすれば、ガイド自体にも――例えば、私がここにあるように――情報が入手・確認できます。つまり、こうしたリポジトリがあるわけです。例えば、モデルの量子化バージョンなら、2ギガ程度といった小さなサイズのものまで用意されており、6ギガのVRAMを搭載したグラフィックカードでも実行可能です。.

ローマン：じゃあ、まず最初の一歩は、実はいいパソコンを買うことなんだね。そういうこと？ハハ。.

ヤクブ：はは、そうですね、高性能なパソコンが必要です。少なくとも、NVIDIA製のGPUで、VRAMが8～10GB程度は必要だと思います。AMD製では動かないでしょう。実験的な形なら動くかもしれませんが、CUDAコアを搭載したGPUが必要です。これが第一歩です。これが揃ったら、次はComfyUIが必要です。これもまた、インターネットから簡単に手に入ります。Hugging Faceのリポジトリから1つダウンロードするだけです。.

また、「ComfyUI Manager」のインストールをお勧めします。これは単にUIアドオンをまとめて管理するツールで、いわばユーティリティのようなものです。これも、わざわざウェブサイトにアクセスして手動でダウンロードする必要はありません。クリックするだけで、GitHubからすぐにダウンロードされます。.

そして、これが用意できたら、あとはまた、単にドラッグするだけです。文字通り、ここに画像をドラッグするだけで、その画像とメタデータがワークフローに埋め込まれていれば、自動的にワークフローが作成されます。これこそが、このツールの素晴らしいところです。つまり、スパゲッティのような複雑なビジュアルコーディングをわざわざ作成する必要はないんです。例えば、これはサイト上のワークフローの一例ですが、画像を放り込むだけで、あっという間に完成するんです。.

では、改めて、ここにあるもの、ここで制御できる項目、そしてそれらが何をもたらすのかについて説明します。ここには、先ほど述べたように、ベースモデル、つまりテキストエンコーダーとモデル本体が用意されています。量子化されているため、品質は低くなり、VRAMの消費も抑えられているので、実際に実行することができます。次に、「シフト」といった設定があります。これはこのモデル固有のものです。いわばコントラストのスライダーのようなものです。シフトを小さくするとコントラストが強くなり、大きくするとコントラストが弱くなります。そういう仕組みになっています。.

次に、ポジティブプロンプトについてです。ええ、その点――どうやって手に入れたか――については後で説明します。そしてネガティブプロンプト。私の理解が正しければ、このツールはネガティブプロンプトにはあまり対応していないようです。繰り返しになりますが、画像生成ツールの中には、そもそもその機能がないものもあります。例えばFluxのように、ネガティブプロンプトに対応していないものもあります。次に画像サイズですが、これは1024ビット四方の正方形といった感じです。 2Kやそれ以上に引き上げることも可能です。ただ、その場合は読み込み時間が長くなってしまうため、この動画の目的上、必要ありません。というわけで、設定は以上です。.

ロマン：ヤクブ、ちょっと聞きたいんだけど。最初に言ったように、実際にすべてを理解するためには、それも努力次第ってことかな――

ヤクブ：そうなんだ。さっきも言ったけど、僕にはプログラミングのスキルも、コンピュータサイエンスの知識も、何もないんだ。僕のバックグラウンドは心理学なんだ。つまり、何も必要ないってこと。それでもこういうものは手に入るんだよ。さっきも言ったように、例えば、文字通りの「ハウツーガイド」的なチュートリアルを動画にリンクさせることもできるし。 40分くらいのチュートリアルがあるんだけど、その内容のほとんどは――チュートリアルって言うより、ある人がZ Image、Flux、Qwenといったモデル同士の比較を解説している、という感じなんだ。.

ヤクブ：つまり、彼がファイルマネージャーを使ってインストール方法を説明するだけなんだけど、正直言って、これって10分くらいしかかからないよ。あれこれやらなきゃいけなくて、すごく難しいってわけじゃないんだ。いや、そんなことないよ。クリック4、5回で済むくらいさ。それに、ChatGPTがすぐそばにいるんだから、もし分からなくなったら、「これ、分からないんだけど。どうすればいい？」って聞けばいいだけ。教えてくれるよ。本当に簡単なんだ。.

例えば、自分のグラフィックカードにはどの量子化モデルを選べばいいのかわからなかったんです。で、これが表示された内容です。だから、そのリポジトリをそのまま貼り付けたところ、「よし、ここに行って、これがモデル一覧だよ。「VRAMが10～12GBあるなら、これを選んでください。これならメモリ容量には十分でしょう。」って。それだけなんです。あとは、こういう手順をすべて実行するだけです。すごく簡単です。本当に何の問題もありません。.

さて、これらすべてを修正したら、最後のステップを終わらせましょう。ステップは非常に重要です。これは、実際に何世代の処理を経るかを示す設定です。というのも、これらの画像（通常は拡散モデル）はすべて、ノイズから始まるからです。つまり、すべての画像が、白黒で粒子の粗い写真のような状態から始まるのだと想像してください。そして、このノイズが何ステップにわたって処理されるかが、ここで決まるのです。.

次にCFG値があります。これは、創造性に対して、モデルにプロンプトへの忠実度をどの程度許容するかを示すものです。つまり、プロンプト通りに正確に実行しなければならない度合いに対して、どれだけ創造性を発揮させてよいかということです。これもまた、調整可能な値です。そして、実際には必要のない基本的な設定がいくつかあります。.

さて、ここをクリックして実行してみると、こんな悪魔のようなキャラクターが現れます。超写実的で、怒り狂った森の精霊の線画のような感じです。ダダダダダ。さあ、実行してみましょう。.

ヤクブ：シードが同じですね。そうですね、毎回シードが変わってしまうのは避けたいので、シードをランダムなものに変更する必要があります。.

ローマン：プロンプト。うーん、そこにたくさんのテキストがあるね。うん。これをどうやって取得すればいいの？

ヤクブ：うん、その通り。うん、ちょっと生成してみせるから見てよ。プロンプトを通過して、今はKサンプラーに入ってる。そこからKサンプラーを経てデコードされ、そうして画像が出来上がるんだ。つまり、この人物の代わりに、この人物ができあがったわけだ。かなり簡単だね。.

この巨大なプロンプトはどうやって手に入れるのでしょうか？プロンプティングというのは、こうしたことを学ぶもう一つの方法のようなものです。例えば、このプロンプトはCivitAIから入手したものです。CivitAIも、ぜひチェックしてみることをお勧めしたいサービスのひとつです。これは、インターネット上でほぼ最大規模のオープンソース・コミュニティサイトです。文字通り「Instagram」のようなものだと考えてください。基本的には、他のクリエイターが投稿した画像や動画にユーザーが投票し、それを閲覧したり、何かを行ったりできるサイトです。.

このサイトの最大の魅力は、実際にアクセスして、自分で学び、さまざまなものを手に入れられることです。例えば、この「森の精霊」は……さっきちょっと見ていたんですが。例えば皆さん、今日の画像……あれは何でしょう？生成されたものですね。ここでは、とても興味深いものをたくさん手に入れることができますよ。.

ところで、ネタバレ注意：私がCivit AI Greenのサイトを使っているのは、Civitai.comというサイトもあるからです。そちらはまるで90%のポルノのようなもので、ユーザーが作成したコンテキストを使って生成されるのがそういうものだからです。なので、念のため言っておきますが、そういう要素がないものをお求めなら、Greenの方を選んでください。そういうコンテンツが含まれているサイトが欲しいなら、基本のサイトです。.

ローマン：今回の録音にぴったりの曲を選んでくれてありがとう。本当に感謝しているよ。.

ヤクブ：大丈夫だよ。改めて言うと、あるクリエイターの画像を見つけただけなんだ。ここで重要なのは画像そのものではなく、やはり右側にあるこの部分で、これを少し拡大してみよう。.

ヤクブ：つまり、ここにあるのは、これが実際にどのように作成されたかを示しているものです。もし本当に必要なら、サイト上で直接実行して、そこで生成することも可能です。クレジットを使って購入すれば、サイト側でもそれが許可されています。でも、オープンソースで公開されているのに、わざわざそんなことをする必要があるのでしょうか？

つまり、ここからわかるのは、Z Image Turboジェネレーターが使われているということです。つまり、文字通りここに行って、ここをクリックするだけで、モデルが手に入るわけです。11月26日にリリースされたもので、ダウンロードしたり、これを使って創作したり、基本的にここから様々なものを得ることができます。また、最新のジェネレーションや、そこで人々が何をしているかといった情報も掲載されています。とはいえ、このモデルについてはすでに知っています。.

次にプロンプトについてです。つまり、プロンプトがあるわけです。このプロンプトを参考に、自由にアレンジして活用することができます。プロンプトには非常に具体的な設定があります。これについては、おそらく別のポッドキャストで詳しく解説する必要があるでしょう。しかし、繰り返しになりますが、こうしたものを一から自分で作成する必要はありません。他の人から学ぶことができます。だからこそ、このサイトはとても重要なのです。.

これが成功の秘訣となるのは、他人の作品を模倣し、リバースエンジニアリングを行ってその仕組みを理解するだけで、素晴らしいものが生み出せるからです。そうすることで、学ぶことができ、しかも非常に、非常に早く習得できるのです。.

それから、他にも重要な点があります。それはメタデータ、つまりそのユーザーがComfyUIでスライダーをどのように設定したかということです。先ほど話した通り、CFGは準拠度をもう少し重視しているため、1.1のみ、8段階となっています。サンプラーについては、必要に応じて同じシードを使用して、まったく同じ画像を生成することも可能です。これも、彼がここにシードを残していたおかげで実現できるのです。.

世代メタデータを公開しない人もいるんです。というのも、彼らは――まあ、プライバシーを守りたいとか、そういう理由からですね。ワークフローにすごく力を入れている人もいるので。でも、ここで紹介されているもののほとんどは、誰でも実践できるし、そのまま参考にして学ぶことができます。これこそがこのサイトの魅力で、本当にたくさんのことを学べるんです。.

ヤクブ：そう、これもかなり簡単だったし、実際、好きなようにできるんだ。ただ試しに――ここに行けば、火のキャラクターをそのままにしておいて――

ローマン：ローマン、何を生成したいのか教えてくれ。

ヤクブ：クリスマスにちなんだことをしようよ。.

ローマン：クリスマス。ゾンビ。.

ヤクブ：ゾンビ。.

ローマン：あのね、『プラントvs.ゾンビ』って覚えてる？

ヤクブ：なるほど、これにはすぐにピンときました。ところで、それを言ってくれてよかった。これらのモデルの魅力は――えーっと、クリスマスの絵葉書……

うん、これ試してみよう。これらのモデルの素晴らしいところは――その点を指摘してくれてよかった――完全に無検閲だということ。これもまた、大きな利点なんだ。だって、ChatGPTや、こうした主要なモデルを使っても、知的財産権に関わるコンテンツを生成することはできないからね。例えば、息子が「ねえ、『アナと雪の女王』のオラフとか、誰か出てきてくれない？」って聞いてきたんですが、無理なんです。なぜなら、こうしたモデルには出力を検閲する別のAIが組み込まれていて、そういうことはできないようになっているからです。ここでは不可能です。.

ローマン：急いで！

ヤクブ：うん、すごく速いね。繰り返しになりますが、先ほども言ったように、私は画質を優先しないモデルを使っているので、これは通常のように画質を上げて調整できるものとは少し異なりますし、もっと優れたモデルもあります。これは「ターボ」モデルなので、画質そのものよりも速度が重視されています。とはいえ、ここでどのような設定にしても、ご覧の通り、驚くほど高品質な結果が得られます。.

でも、繰り返しになりますが、もし私が、先ほど言ったように、『アナと雪の女王』のエルサとアナが巨大な氷の城の前に立っているような、映画のような、高品質でリアルな画像を作るとしたら――試してみましょう。そうですね、こうしたタグやキーワードを多く追加すればするほど、当然ながら画像の質は向上します。これは言うまでもないことです。先ほども言ったように、このプロセスを学ぶことを誰にでもお勧めします。.

あ、ほら！ほらね？

ローマン：ああ、それは文字通り……まあ、そうだな、95%みたいな感じだね。.

ヤクブ：もっと細かい部分で微調整をすれば、って感じで――ほら、氷の部分にはあちこちでそういう手を加える必要があるかもしれない。そう、それはすごく簡単にできるよ。.

ローマン：御社の法務部門は、これにはきっと快く思わないだろうが――

ヤクブ：うん、うん、うん。でも、繰り返しになるけど、好きなようにやればいいんだよ。そこが魅力なんだ。それに、完全に無料だし。ほら、必要なのは電気とGPUだけ。本当にそれだけの話さ。.

とはいえ、やはり皆さんには、まずはこれをちょっと触ってみて、一通り試してみて、その仕組みを学んでみることをお勧めします。というのも、繰り返しになりますが、この同じプロセス――つまり仕組み――は、あらゆる表現形式に応用できるからです。先ほども言ったように、テキストから動画、画像から動画、2Dアート、3Dアート、音声など、何にでも適用できます。仕組みは同じです。そして、その仕組みの根底にあるものや、実際にどれだけの制御が可能なのかを理解することは、皆さんにとって重要だと思います。だって、本当に素晴らしいですから。.

そして、おそらく最後はこれになると思います。これは私が取り組んでいた、私の代名詞とも言える機能です。そう、これを使えば、はるかに、はるかに、はるかに細かい制御が可能になります。これは非常に高度なワークフローで……あ、これじゃなくて、すみません、こっちです。はい、これでいいです。実行させておいてください。というのも、これは実は240ステップもあるからです。.

ローマン：それってどういう機能なの？　よくわからなかったんだけど。どういう機能なの？

ヤクブ：うん、うん。つまり、ここでやっているのは、実際には アニメ『Ion on Justice』のモデル, 、そしてこのモデルは140ステップのみ使用しています。私たちが目指しているのは、ゲーム用に、リアルなスタイルでユキヒョウを擬人化した戦士を生成することです。ここにはかなり長いプロンプトがあり、ネガティブプロンプトもかなり長いです。.

これを作るのに少し時間がかかりました。でも、リアルに仕上げたいと思っているのですが、ここで使っているアニメモデルではリアルな表現ができないんです。では、一体何が起きているのでしょうか？

では、どうすればいいか。リファイナーを使います。その仕組みはこうです――140ステップを経た後、このモデルは停止し、そこで別のモデルを組み込むのです。.

そこで現在、フェネキンを通じて2つのモデルによる生成を行っています。フェネキンは写実的なモデルで、生成の最終段階として、さらに100ステップかけて画像のノイズ除去を行います。つまり、合計で240ステップまで進むわけです。だからこそ、3分ほどかかっているのです。そして、この処理によって、個々のモデルだけでは作り出せなかったものが生み出されるのです。繰り返しになりますが、私たちが求めているのはファンタジー風のユキヒョウの戦士のようなキャラクターです。インターネットで見つけたどの作品にも満足できなかったので、ひたすら深く、深く、深く掘り下げて、このプロジェクトに没頭していったのです。.

非常に重要なのは、このモデルと、ここにあるワークフローです――ちなみに、ここに表示されているものの半分も実際には使っていません。ここには、基本的にこのワークフローの可能性が示されており、それらを関数のように自由に組み合わせて使うことができます。つまり、ここをクリックして有効にするか無効にするか、というだけです。画面上で紫色になっている部分はすべて、現在非アクティブであることを示しています。OpenPoseやIPアダプター、ControlNetアップスケーラーなど、これら他の機能は一切使用していません。このシステムには非常に多くの機能がありますが、それらをすべて解説するには、また別のポッドキャストが必要になるほどです。.

でも、できることはまだあります――「ディテール」のような生成後の補正機能を使っているんです。これが本当に重要なポイントです。例えば、ここで生成した画像を見てみると、確かに素晴らしいですが、この2つにはどこか違和感があります。目や体の位置などがおかしいというわけではなく――まるで『Wish』に出てくるキャラクターのような見た目なんです。.

つまり、ここではワークフローが進行している最中に、実際にリアルタイムで状況を確認できるわけです。さて、すでにADetailerに読み込まれています。ここにベース画像がありますが、ご覧の通り、完璧とは言えません。顔がちょっと歪んでいるような感じです。そうですね、これはあまり望ましい状態ではありません。では、何が起きているのでしょうか？「フェイスディテーラー」というツールがあり、これは実際に顔の部分だけを修正します。つまり、すでにここにある画像に、さらに別の処理を重ねているわけです。それだけでなく、目を少し整えて、より良い状態にする修正も行っています。.

ローマン：ああ、そうか、そうか、そうか。なるほど、なるほど。.

ヤクブ：基本的にはそうですね。そして、こうすることもできます――繰り返しになりますが、手と体の両方のセットアップを含めて、4つのパスを行うことができます。体の位置が、やはり少し固定されているのがお分かりいただけると思います。.

先日、ネットでいろいろ調べていたところ、あるAIエージェンシーの専門家が自身のワークフローを紹介していて、1枚の画像を「理想の状態」、つまり最高品質に仕上げるのに、およそ20時間と500回の生成が必要だと話していました。例を挙げると、「息子の写真からオラフを生成して」といった本当に基本的なものから、これほど高度なものに至るまで、その仕組みはこうなっています。というのも、繰り返しになりますが、これはある意味で完璧でなければならないものだからです。なぜなら、それがまさに、あなたが何をしたいのかを定義するものだからです。.

ヤクブ：で、もう一度、ここのどこかを見てみましょう――これじゃなくて、私が本当に、本当に気に入ったあのクリエイティブ――これじゃない。うん、これだ。ほら、このクリエイティブがどれほど美しいか分かる？　文字通りピクサーの映画みたいだ。そして、繰り返しになるけど、このクオリティを実現できるのは、高度なワークフローを活用できるからなんだ。そうして最終的に手に入るのは、こうした完璧なクリエイティブなんだ。.

つまり、繰り返しになりますが、そこがまさにこの手法の素晴らしいところなんです。というのも、これは文字通り、ハイレベルな映画のような仕上がりになっているからです。まるで、誰かが、繰り返しになりますが、膨大な労力と時間を費やして作り上げ——つまり、描き上げるようなものです。しかし、実際には、高度なワークフローのタイムラインを使えば、それを簡単に生成できるのです。もちろん、一貫性のあるキャラクターやその他さまざまな要素も必要になりますが。.

でも先ほども言ったように、これはこれらすべてを実現するための第一歩のようなものです。ですから、クリエイティブを制作しているどのクリエイティブチームにとっても、AI――つまり画像生成や動画生成の習得――は、来年、いわば「存亡をかけた課題」になると思います。なぜなら、その膨大な量に到底追いつけなくなるからです。それは本当に、本当に難しいことです。そして、十分な量のクリエイティブを用意できれば、本来ならCPIは下がるはずなのに、逆に高くなってしまいます。つまり、結局のところ、これらすべての事柄は基本的にその一点に帰着するのです。.

それに、さっきも言ったように、これはすごく複雑そうに見えるけど、実はそうじゃないんだ。だって、これがどれほど複雑になり得るかについては、まだほんの表面をなぞった程度に過ぎないからね。今お見せしているのは、あくまで基本的なことだけで、本質にはまだ全然触れていないんだ。.

ローマン：うん、両方のスキーマを併せて検討するこのやり方が、すごく気に入ってるよ。結局のところ、僕たちは画像を生成するわけだからね。.

ヤクブ：うん、うん、うん、うん、そうだな。うん、ここには立派な戦士がいるね。でも、繰り返しになるけど、結局のところ、好きなようにやればいいんだ。そして、さっきも言ったように、そこが魅力なんだ。自由に試してみて、自分で体験してみればいい。クレジットを食い尽くすような、金に目がくらんだウェブサイトなんてないんだ。さっきも言った通り、必要なのはGPUと電気代だけ。だから、好きなようにやればいい。僕は今、12K、13K世代くらいは過ぎたと思う。.

そうそう、たまに、例えばここでも、8つずつとか、そういうバッチ処理ができる設定があるんですよね。そのまま寝てしまって、処理が終わるのを待ってから、一番いいものを選べばいいんです。私も時々そうしてます。うん、まるで放置系ゲームみたいなもので、終わったら戻ってきて、報酬を受け取るだけってわけさ。.

でも、こういう仕組みがどうなっているのかを知ることができるというのは、とてもやりがいがあると思います。というのも、実際に現場に行って、クリエイティブや、今トレンドになっている様々なものを見れば――たいていの場合、見ただけでどの世代のモデルか見分けがつくんです。というのも、モデルによっては非常に特徴的なものがあり、一目でそれがわかるからです。.

例えば、ChatGPTの画像はどれも、背景にオレンジ色の色合いがかかっています。では、ここにある最後の画像の一つを見てみましょう……そう、これです。これは『キャンディークラッシュ』が展開している広告素材なのですが、画像の周囲にオレンジ色のニュアンスが漂っているのがわかりますよね。これは、ChatGPTの画像をベースにしていることを意味しています。ここでは、それが非常に、非常に、非常に目立っています。そうですね。とはいえ、やはり非常に微妙な違いです。でも、こうした画像を1万枚も見てしまうと、後になってはそれが非常に明白にわかるようになります。.

したがって、これらのチームがどのように活動し、どのように成果を生み出しているかをすぐに把握でき、自分でも実践することができます。繰り返しになりますが、これにより、このプロセスにおいて大きな優位性を得ることができます。.

ローマン：そして、これは本当にスキルですよね。おそらく2026年頃には――クリエイティブ業務に携わっている人なら、UAマネージャーとしてそれが職務の一環である場合でも、クリエイティブチームの一員である場合でも。.

最後に要点をまとめると、ChatGPTやClaudeのようなクラウドベースのサービスでは、できることの柔軟性が低くなります。そのため、私たちはオープンソースのモデルを利用したいと考えています。.

ヤクブ：正直なところ、それらを組み合わせて使うこともできるんですよ。例えば、オープンソースのモデルで画像を生成して、それをさらに洗練させた上で、動画生成ツールを使うといった具合に。動画生成ツールはかなり重要だけど、それはあくまで最後の工程みたいなもので、つまり、生成したいものはベースとなる画像から始まるわけだけど、その組み合わせとしては、「うーん、ComfyUIを使って画像を生成したい」といった組み合わせも可能だし、仕上げにVeo 3を使って動画を作成する、といった感じだ。繰り返しになるが、好きなようにできるんだ。.

理想を言えば、すべてを試してみて、自分に一番合うものを見つけることです。そこが素晴らしいところですね。でも、こうしたことを知っていれば、自分で試してみるという選択肢も生まれます。そうでなければ、「ああ、Veo 3を使えばいいや。それしか知らないし」という感じで、それきりになってしまいます。.

ローマン：なるほど。.

ヤクブ：それに、これらにはもうひとつ大きな問題があって――こういうものはすぐに陳腐化してしまうんです。厳密には「陳腐化」というよりは、新しいものが次々とリリースされるので、それに追いついていかなければならないんです。例えば、ここのクリエイティブ作品を見ていると――そう、これとか、あるいはもう少し古いものとか――その中には、明らかに古いモデルで動作しているものがあるのがわかります。まだアップデートしていないだけなんだけど、これもまた当然のことだよね。だって、ここのアップデートサイクルは3ヶ月くらいだから。でも、最先端のものを活用したいよね。だって、そうすることで品質面などで優位に立てるし、他にもいろんなメリットがあるからね。そう、とにかく、本当に、本当にスピードが速いんだ。.

ロマン：ヤクブ、どうやってそのペースを維持してるの？君自身は？時間はあるの？

ヤクブ：どうかな。まあ、そうね、わかるよ。僕はもちろん、AI関連のポッドキャストをいくつか聴いているんだ。文字通り、リンクを貼れるんだけど――これは、僕の意見では――この「AI Search」というYouTubeチャンネルは、文字通り、ある男性がただニュースを伝えているだけなんだ。毎週、「今週は何がリリースされた？」って感じで、すべてのモデルを網羅して紹介してるんだ。それに、比較動画とか、そういう特定のトピックに特化した動画もある。だから、このまとめ動画は、僕がすごく定期的に見てるんだ。.

ヤクブ：それから、業界関連のポッドキャストもいくつか聴いています。例えば、ChatGPTとマイクロソフトの最新動向とか、そういった話題ですね。もちろん、Civitaiのサイトに行って、人々がどんな作品を作っているか見てみるのもいいですよね。.

例えば、ここを見ると、こうしたものがたくさんあるのがはっきりとわかります。ええと、実はChatGPTがかなり多く含まれていますね。それから、これは何でしょう？そう、Google Nano Bananaですね。最近、かなりトレンド入りしています。そして、人々が何を生成しているか、市場には何が流通しているかが一目でわかります。これを見れば、「ああ、なるほど、基本的にそういうことか」とわかるわけです。つまり、誰が何を生成しているのかがわかるわけですよね？

ロマン：本当に興味深いですね。あなたはもともとゲームデザインの専門家なのに、今はゲームのクリエイティブな部分に完全に没頭しているんですから。完全にね。どんな気分ですか、ヤクブ？

ヤクブ：ああ、最高だよ。僕はいつもちょっとそれに夢中になっちゃうんだけど……でもやっぱり、最大の問題は、これがどう機能しているのか理解できていなかったことなんだ。僕にとっては、それが一番気になってしまう点で、「何か手を打たなきゃ」って思うんだ。だって安心できないし、どう言えばいいかな？仕組みが分からないと、状況を把握できていない気がするんだ。.

だから、ついこの「ウサギの穴」に飛び込んで、これについて学びたくなってしまうんです。というのも、繰り返しになりますが、何かを知らないなら、せめてそれがどう機能するかは知っておくべきだからです。実際にそれをやる必要はありませんが、少なくともこうした選択肢があることは知っておくべきです。そうすれば、取り残されることはないからです。誰かに何かを言われたとき、その話がでたらめだと見抜くこともできず、それが最善なのか、そうでないのか、あるいは相手が真実を話しているのかさえ分からない、といった状況に陥ることもなくなるのです。.

そう、繰り返しになりますが、最近のAIは本当に急速に進化しており、今や私たちの生活において最も重要な技術の一つとなっています。それなら、一石二鳥を狙ってみてはどうでしょうか？　繰り返しになりますが、ゲーム業界の専門知識を持つ私たちにとって、これは必要なことなのです。一方で、もちろんAIは確実に普及し、様々なものを変えていくでしょう。それは間違いありません。.

とはいえ、現時点でこれがもたらす利点は、例えばゲームの面――いや、ゲームプレイの面では、それほど大きな変化はないだろうということだ。マッチメイキングや、その他細かい部分――何だっけ、よく分からないけど――の最適化には役立つかもしれない。しかし、AIが、いわゆる「AI対応ゲーム」――つまり、AI機能なしでは成立しないようなゲーム――を実現する段階には、まだ達していません。その転換点には、まだ到達していないのです。.

例えば、1999年かそこらに『Doom 3D』が発売された頃のような状況とは違います。あの頃は、3Dという特性のおかげで、2Dではできなかったことが可能になったからです。私たちはまだその段階には達していません。繰り返しますが、なぜでしょうか？　これについて学べば、「あれ？　これって理にかなっていない。まだまともにコーディングすらできていないのに、幻覚ばかりだ」と気づくからです。“

ロマン：すべてはつながっているんですね。さて、ヤクブさん、とても示唆に富んだお話でした。皆さんからもたくさんの質問があると思います。コメント欄に質問を書き込んでください。ヤクブさんに時間ができた時に、それらに答えてもらうようにします。.

最後に何か一言ありますか？もちろん、動画内で触れた「Two and a Half Gamers」やその他のコンテンツへのリンクはすべて説明欄に掲載しておきます。でも、特に年末ということもあり、ヤクブにも何か一言言ってほしいんです。ヤクブ、最後に一言お願いします。

ヤクブ：うん、うん。さっきも言ったように、質問やご意見、コメントなどがあれば、動画の下に気軽に書き込んでください。あるいは、「Two and a Half Gamers」のSlackに参加してもいいですよ。そこは誰でも参加できて、知識を共有したり、他の人と交流したりできる場所です。.

ヤクブ：うん、そうだな……さっきも言ったけど、最後に言いたいのは「さあ、今すぐ学び始めよう」ってこと。手遅れになってから「追いつくにはもう遅い」なんてことにならないように、待たないでほしい。.

ロマン：その通り、その通り。この点で締めくくろう。いいねとチャンネル登録をお願いします。今回のエピソード、きっと気に入っていただけたと思います。そして、ヤクブ、本当にありがとう。.

ヤクブ：うん、大丈夫だよ。じゃあ、そこで会おう。じゃあね。.

ローマン：じゃあね。.

マーケティング・コンテンツ・マネージャー

タラ・マイヤー

私はモバイルアトリビューションとアプリ分析に新しい視点をもたらし、洞察を、ユーザーとつながり成長を促進する戦略へと変換します。

こちらにも興味はありますか

トルコ・モバイルアプリ奨励プログラム：申請チェックリスト

タラ・マイヤー

トルコ・モバイルアプリ奨励プログラム：申請チェックリスト

トルコのモバイルアプリ奨励プログラムは、モバイルアプリ開発者にとって世界でも最も手厚い支援制度の一つです。このモバイルアプリ奨励制度では、輸出志向の企業を対象に、対象となる広告費、プラットフォーム手数料、ソフトウェア費用、市場参入費用の一部を還付しており、支援水準や上限額はカテゴリーやプログラムのトラックによって異なります。[1][4][5][6] 適切な...

TenjinのMCPサーバー：データを直接照会し、分析をもっとスムーズに

広告収益ベンチマークレポート2025 - プラットフォーム、国、アドネットワーク別広告収益シェア、広告フォーマット別eCPM

ブログ

ComfyUIワークフロー：2026年にモバイルゲームを成長させる無料AIツール

タラ・マイヤー

ComfyUIのワークフロー、オープンソースのAIツール、およびクリエイティブ・パイプラインにおけるメリットに関するガイド

学習内容：

なぜオープンソースAIワークフローが「ブラックボックス」ツールに勝るのか

西洋の「ブラックボックス」アプローチ

中国のオープンソースAIエコシステム

これがモバイルゲームのUAにとって重要な理由

成長のためのツール：ComfyUIのハードウェアとソフトウェア要件

ハードウェアへの投資

ソフトウェアスタック（すべて無料）

学習への時間投資

クリエイティブ・オートメーション・ツールの比較：ComfyUI 対 代替ツール

モバイルゲームUAに関する結論

ComfyUIチュートリアル：画像から動画へのワークフロー

なぜ「テキスト→動画」はスケールしないのか

「画像ファースト」のプロフェッショナルパイプライン

クリエイティブ自動化ツールがチームにもたらす利益

クリエイティブ疲労と燃え尽き症候群の回避

新しいパイプラインが競争上の堀を構築する

速度と量がモバイルゲームの成功を決定する

クリエイティブ生成からパフォーマンス測定までの全プロセス

こちらにも興味はありますか

タラ・マイヤー

トルコ・モバイルアプリ奨励プログラム：申請チェックリスト

タラ・マイヤー

トルコのモバイルアプリ奨励プログラムガイド（2026年）

タラ・マイヤー

Tenjin SDK 統合における AI アシスタントの活用方法：開発者向けガイド

タラ・マイヤー

Tenjinのオールインクルーシブプラン：無料版と有料版、コンバージョン数の上限、そして実際に必要なもの

タラ・マイヤー

2026年、AppsFlyerに代わる最適なMMP：Adjust vs Singular vs Tenjin

タラ・マイヤー

MMPの選び方：避けるべき9つの間違い

タラ・マイヤー

モバイルマーケティングにおけるOpenClawとAI自動コンテンツ作成の活用方法

タラ・マイヤー

Google ODMとICM解説：2026年にアプリ広告主が知っておくべきこと

タラ・マイヤー

モバイルマーケターのための広告クリエイティブテストの方法

タラ・マイヤー

ユーザー継続率指標の違い：ゲームとアプリ

タラ・マイヤー

バイラルコンテンツ製造マシンの構築：バイラルコンテンツとクリエイティブの作り方

タラ・マイヤー

ゲームからアプリ投資へ：2026年にモバイルアプリポートフォリオを多様化すべき理由

タラ・マイヤー

クリエイターエコノミーとは？なぜマイクロインフルエンサー(Micro-Influencers)がモバイルのユーザー獲得を再定義するのか

タラ・マイヤー

F2Pゲームにおけるユニット・エコノミクス：利益を生むフリーToプレイのビジネスモデル

タラ・マイヤー

アプリ内広告の収益を算出する方法：実績のあるフレームワーク

タラ・マイヤー

インドにおいてモバイルゲームに勝つ方法：モバイルアプリローカライゼーション戦略

タラ・マイヤー

2026年の広告クリエイティブ：今すぐAIワークフローを導入すべき10の理由

タラ・マイヤー

IAA & IAP:広告収益アトリビューションにおける違い

タラ・マイヤー

アプリ継続率向上の戦略は、適切な指標の選択から始まる

タラ・マイヤー

モバイルゲームの収益化：ジャンルが成長に与える影響

タラ・マイヤー

LTV予測 (pLTV)とは?

タラ・マイヤー

ハイブリッド収益化における予測LTV：4つの課題を解決

タバラク・パラチャ

Pythonでモバイルマーケティングを実践〜ASOキーワードリサーチ＆Meta広告での競合スパイ活用法

タバラク・パラチャ

100以上のモバイルゲームを開発： PSVゲームスタジオはどのようにTenjinを利用してグロースを促進したか

タバラク・パラチャ

TikTokアプリ広告入門：スパーク広告とクリエイティブの実践手法

タバラク・パラチャ

Tenjin:2025年パキスタンにおけるモバイルゲームの現状

ヘンリー・リー

中国のトップ・モバイル・パブリッシャーがいかにしてハイブリッド・カジュアル市場を開拓したか - ZPLAYのケーススタディ

クリエイティブ・オートメーション・ツールの比較：ComfyUI 対代替ツール

2025年ブラジルにおけるモバイルゲームの現状：データ、動向、市場分析

LiveOpsキャンペーン：実用的なアトリビューションインサイトでアプリの成長を促進する