「画像生成の技術」で文章を作るAIが現れた──Google「DiffusionGemma」が示す高速化の新潮流

文章を「左から順に」作らないAIの登場

ChatGPTもClaudeも、これまでの生成AIは文章を頭から一語ずつ予測して紡ぐ「自己回帰型」が当たり前だった。Googleが2026年6月に公開した「DiffusionGemma」は、画像生成でおなじみの「拡散（diffusion）」という仕組みをテキスト生成へ持ち込み、その常識をひっくり返す。まずノイズだらけの状態を用意し、そこから何度も並列で精製を重ねて、文章のブロックをまとめて浮かび上がらせるのだ。絵が霧の中から像を結ぶように、文章を一気に形づくる発想である。一語ずつ積み上げないため、生成の考え方そのものが従来とは根本から異なる。専門メディアは拡散モデルでテキスト生成を最大4倍高速化したオープンモデルを公開したと伝えている（26/06/11）。(Ledge.ai)

毎秒1000トークンという速さの正体

注目すべきは速度だ。一語ずつ積み上げる方式は原理的に逐次処理で、長い文章ほど待ち時間が増える。拡散方式は複数の箇所を同時に確定できるため、手元のGPUでも一気に書き上げられる。報道によればローカルGPUで毎秒1000トークン超を実現する実験的オープンモデルだという（26/06/11）。(ITmedia) 中身は26BのMixture of Experts構成ながら、推論時に動くパラメータは3.8Bだけに絞られている。さらにApache 2.0ライセンスで重みごと無料公開され、企業も個人も手元の環境に取り込んで自由に改造できる。クラウドに頼らず完結する設計が、速度と並ぶもう一つの武器だ。

狙いは「賢さ」ではなく「速さと手元で動くこと」

ここが今回の本質だ。DiffusionGemmaは標準のGemmaを置き換える最高性能モデルではなく、コード補完やインライン編集のように「速い反復」が効く用途に振り切っている。書いては直す対話的な作業では、賢さよりも返答の速さが体験を決めるからだ。巨大モデルが難問を解く賢さを競う一方で、Googleは「手元で、低遅延で、対話的に動く」領域に旗を立てた。NVIDIAも自社ブログでローカルAIの実現に向けてDiffusionGemmaを高速化すると表明しており、チップ側の最適化も同時に進む（26/06/12）。(NVIDIA) ソフトとハードが足並みをそろえている点も見逃せない。

なぜGoogleはこのタイミングで出したのか

なぜ今なのか。競争の地図が変わったからだ。モデルの賢さは各社とも頭打ちに近づき、利用者が日々触れるのは難問ではなく、要約や下書き、コード補助といった日常作業である。そこでは応答が速く、通信も発生せず、無料で動くことが何よりの価値になる。ChatGPTが圧倒的な利用者数を抱える今、正面から賢さだけで殴り合っても分が悪い。だからGoogleは別の土俵を選び、無料のオープンモデルで開発者を自陣へ呼び込む。無料でばらまくほど損に見えるが、開発者の裾野を押さえることこそ、長い目で見たGeminiの勝ち筋なのだ。

生成AI競争は「第2幕」に入った

2026年のAI競争はモデルの賢さ比べが一巡し、軸は「どう速く、どこで動かすか」へ移りつつある。拡散型テキスト生成はまだ実験段階で、長文の一貫性や精度では自己回帰型に分がある。それでも、かつて画像の世界で主流を奪った拡散モデルが、文章でも居場所を作り始めた事実は重い。AIの進化は「もっと賢く」だけでなく「もっと速く、もっと身近に」という別の競争へ確実に分岐した。次に主役へ躍り出るのは、巨大なクラウドではなく、あなたの手元で静かに走るモデルなのかもしれない。

参照ソース（噂の出どころ）

「Google DeepMind、拡散モデルでテキスト生成を最大4倍高速化」（Ledge.ai・26/06/11）https://ledge.ai/articles/google_deepmind_diffusiongemma_text_diffusion

「Google、拡散型テキスト生成モデル『DiffusionGemma』公開ローカルGPUで毎秒1000トークン超」（ITmedia・26/06/11）https://www.itmedia.co.jp/aiplus/article/2606/11/2000000079/

「NVIDIA、ローカルAIの実現に向けてDiffusionGemmaを高速化」（NVIDIA Japan Blog・26/06/12）https://blogs.nvidia.co.jp/blog/rtx-ai-garage-local-gemma-diffusion/

「Google、最大4倍高速のテキスト生成モデル『DiffusionGemma』発表」（CodeZine・26/06/11）https://codezine.jp/news/detail/24522

コメントを残すコメントをキャンセル

次期フラグシップGPU「RTX 60シリーズ」への布石──RTX 5090シリーズの先にあるもの

Switch2の夏は“新作より移植”で埋まった──32本ラインナップが映す初年度のしたたかさ

折りたたみが値上げしても選ばれる時代へ──Galaxy Z Fold8 Ultraが引いた新しい線

8月にK-POPが一斉カムバックする裏側──夏をめぐる“席取り合戦”の正体

Trending

Switch2の夏は“新作より移植”で埋まった──32本ラインナップが映す初年度のしたたかさ

折りたたみが値上げしても選ばれる時代へ──Galaxy Z Fold8 Ultraが引いた新しい線

8月にK-POPが一斉カムバックする裏側──夏をめぐる“席取り合戦”の正体

続編アニメで埋まった2026年夏──『リゼロ』4期が“奪還編”をわざわざ分けて出すワケ