Як інформує «Перший Новинний» із посиланням на матеріал Wired, під час щорічної конференції розробників Google I/O було представлено технологію створення персоналізованих штучних аватарів. Ці цифрові копії легко вмонтовувати в будь-який відеоролик, що генерується засобами штучного інтелекту (ШІ).
Функціональні можливості Flow
Віцепрезидент з управління продуктами експериментального підрозділу Google Labs Еліас Роман у межах заходу Google I/O продемонстрував оновлений інструментарій сервісу Flow. Ця платформа призначена для створення та редагування відеоконтенту й зображень за допомогою нейромереж. Завдяки новій функції користувачі можуть відсканувати свою зовнішність, імплементувати високоточного цифрового клона та долучати його до будь-яких генерованих кліпів. За словами Романа, розробка орієнтована на авторів контенту, які прагнуть бути присутніми в кадрі без необхідності витрачати час на повноцінні знімальні процеси.
Це рішення доповнює глобальну стратегію Google, спрямовану на те, щоб зробити концепцію «вайб-кодингу» та використання агентів штучного інтелекту стандартом для широкої аудиторії. Наприклад, у Flow тепер можна задавати повторювані інструкції для автоматизації процесів, зокрема сортувати кліпи за стилістикою у відповідні папки.
Технічні особливості та модель Omni Flash
Головним технологічним фундаментом оновленого сервісу стала сучасна модель генерації відео Omni Flash, яка замінила попередню нейромережу Veo. Якщо попередня модель Nano Banana була зосереджена на глибшому розумінні контексту реального світу для створення зображень, то Omni Flash значно покращує якість відеовиробництва, додаючи кожному кадру виняткової деталізації. Окрім цього, нова модель успішно усуває критичну проблему попередніх версій Flow — небажані викривлення та втрату чіткості обличчя персонажів при створенні послідовних відеосцен.
Механіка створення аватара
Процес створення персонального цифрового двійника виглядає так:
- Користувач переходить до налаштувань свого профілю у Flow.
- Сканує QR-код за допомогою власного смартфона.
- Записує коротке відео, під час якого необхідно вимовити певну послідовність цифр і повертати голову, щоб система зафіксувала обличчя під усіма ракурсами.
Механіка роботи багато в чому перегукується з аналогічною функцією застосунку Sora від компанії OpenAI. Важливо, що Google впровадила суворі обмеження: генерувати можна виключно копії власної зовнішності, а на всі відеоролики з використанням аватарів автоматично накладається невидимий цифровий водяний знак SynthID.
Практична демонстрація та стратегія розвитку
Під час конференції Роман показав жартівливий ролик, де його реалістичний цифровий двійник, що відтворював голос автора, відчитував команду розробників Flow на фоні сміттєвого бака. Прямо в інтерфейсі сервісу він за допомогою текстових запитів оперативно змінював фон відео та колір свого одягу — модель Omni Flash миттєво адаптувала сцену, зберігаючи при цьому ідентичність зовнішності персонажа.
Ця розробка не є першою спробою корпорації впровадити інструменти для створення «дипфейків»: близько 1 місяця тому обмежений функціонал створення аватарів з’явився у YouTube Shorts. Аналогічні рішення розвивають і конкуренти: компанія Meta минулого року презентувала ШІ-перекладач для Instagram Reels, який змінює не лише озвучку, а й адаптує міміку губ під мову іншою мовою.
Для творців контенту впровадження таких інструментів означає значне спрощення виробничого циклу. Водночас зростання популярності генеративного ШІ викликає дискусії в аудиторії, яка все частіше сприймає такий контент як штучний, навіть якщо глядачі не завжди можуть з першого погляду відрізнити цифрову копію від реальної людини.
Раніше ми писали про те, чому повнорозмірні навушники — це особливий досвід.
