文章を「左から順に」作らないAIの登場

ChatGPTもClaudeも、これまでの生成AIは文章を頭から一語ずつ予測して紡ぐ「自己回帰型」が当たり前だった。Googleが2026年6月に公開した「DiffusionGemma」は、その常識をひっくり返す。画像生成でおなじみの「拡散(diffusion)」という仕組みを、テキスト生成に持ち込んだのだ。一語ずつではなく文章のブロックをまとめて生成し、ノイズだらけの状態から何度も並列で精製していく。専門メディアは拡散モデルでテキスト生成を最大4倍高速化したオープンモデルを公開したと伝えている(26/06/11)。(Ledge.ai)

毎秒1000トークンという速さの意味

注目すべきは速度だ。一語ずつ積み上げる方式は原理的に逐次処理で、長い文章ほど待ち時間が増える。拡散方式は並列でまとめて処理できるため、手元のGPUでも高速に生成できる。報道によればローカルGPUで毎秒1000トークン超を実現する実験的オープンモデルだという(26/06/11)。(ITmedia) 中身は26BのMixture of Experts構成ながら、推論時に動くパラメータは3.8Bだけ。Apache 2.0ライセンスで重みごと無料公開され、誰でも手元で動かせる。

狙いは「賢さ」ではなく「速さと手元で動くこと」

ここが本質だ。DiffusionGemmaは標準のGemmaを置き換える最高性能モデルではなく、コード補完やインライン編集のように「速い反復」が効く用途に振り切っている。クラウドの巨大モデルが賢さを競う一方で、Googleは「手元で、低遅延で、対話的に動く」領域に旗を立てた。NVIDIAも自社ブログでローカルAIの実現に向けてDiffusionGemmaを高速化すると表明しており、PC側の最適化も同時に進む(26/06/12)。(NVIDIA)

生成AI競争は「第2幕」に入った

2026年のAI競争はモデルの賢さ比べが一巡し、軸は「どう速く、どこで動かすか」へ移りつつある。拡散型テキスト生成はまだ実験段階で、長文の一貫性や精度では自己回帰型に分がある。それでも、画像の世界で主流を奪った拡散モデルが文章でも居場所を作り始めた事実は重い。AIの進化は「もっと賢く」だけでなく「もっと速く、もっと身近に」という別の競争へ分岐した。次の主役は、クラウドの外で静かに動くモデルかもしれない。

参照ソース(噂の出どころ)

「Google DeepMind、拡散モデルでテキスト生成を最大4倍高速化」(Ledge.ai・26/06/11)https://ledge.ai/articles/google_deepmind_diffusiongemma_text_diffusion

「Google、拡散型テキスト生成モデル『DiffusionGemma』公開 ローカルGPUで毎秒1000トークン超」(ITmedia・26/06/11)https://www.itmedia.co.jp/aiplus/article/2606/11/2000000079/

「NVIDIA、ローカルAIの実現に向けてDiffusionGemmaを高速化」(NVIDIA Japan Blog・26/06/12)https://blogs.nvidia.co.jp/blog/rtx-ai-garage-local-gemma-diffusion/

「Google、最大4倍高速のテキスト生成モデル『DiffusionGemma』発表」(CodeZine・26/06/11)https://codezine.jp/news/detail/24522

コメントを残す

Trending