Як інформує «Перший Новинний» із посиланням на сторінку Google DeepMind, компанія випустила Gemma 4 — четверте покоління відкритих моделей, побудоване на технологіях Gemini 3. Уперше в лінійці з’явилася модель із архітектурою «суміш експертів» (Mixture of Experts): при 26 млрд параметрів вона активує під час інференсу лише 3,8 млрд, що дозволяє працювати швидко без втрати глибини знань. Усього до сімейства увійшли чотири моделі — E2B, E4B, 26B MoE та 31B Dense, ваги яких уже доступні на Hugging Face.
Технічні переваги та продуктивність
Старша модель, 31B Dense, уже посіла третє місце серед відкритих моделей у рейтингу Arena AI Text. За словами дослідників Google DeepMind Клемана Фарабе та Олів’є Лакомба, команда прагнула максимізувати «інтелект на параметр» — і 31B-модель дійсно конкурує з моделями значно більшого розміру. Молодші E2B та E4B розраховані на компактні пристрої — від смартфонів на Android до Raspberry Pi та Jetson Nano — і здатні працювати повністю офлайн.
Мультимодальність та агентські сценарії
Усі чотири моделі є мультимодальними: вони приймають зображення та відео, а молодші E2B та E4B додатково підтримують аудіовхід, що відкриває можливість розпізнавання мовлення прямо на пристрої. Контекстне вікно складає до 128 тис. токенів у компактних версій та до 256 тис. у старших.
На відміну від попередніх поколінь Gemma, у четвертого є нативна підтримка виклику функцій та структурованого виводу в JSON — тобто моделі спочатку спроєктовані для агентських сценаріїв.
Доступність та ліцензування
Gemma 4 підтримує понад 140 мов і розповсюджується під ліцензією Apache 2.0, що знімає більшість комерційних обмежень. Ваги доступні на Hugging Face, Kaggle, Ollama, LM Studio та Docker. Для Google цей реліз — крок до домінування в сегменті «локального ШІ»: навіть старші моделі сімейства поміщаються на одному GPU, що робить їх привабливими для завдань із низькою затримкою та вимогами до цифрового суверенітету.
Раніше ми писали про те, що Opera дозволить стороннім ШІ-моделям керувати браузером Neon.
