#geminiomniflash — Public Fediverse posts
Live and recent posts from across the Fediverse tagged #geminiomniflash, aggregated by home.social.
-
Google I/O 2026: Gemini Omni Flash oficjalnie. Interaktywna edycja wideo i generowanie treści z dowolnych danych
W zeszłym roku Google udostępniło narzędzie Nano Banana do edycji grafiki, a podczas konferencji Google I/O 2026 przyszedł czas na kolejny krok w rozwoju natywnej multimodalności.
Gigant zaprezentował model Gemini Omni (w pierwszej kolejności wersję Gemini Omni Flash), który łączy zaawansowane wnioskowanie sztucznej inteligencji z możliwością jednoczesnego przetwarzania i generowania obrazów, dźwięków, filmów oraz tekstu. Najważniejszą nowością jest możliwość pełnej edycji materiałów wideo za pomocą zwykłej, swobodnej rozmowy z modelem.
Konwersacyjna edycja wideo i realizm fizyczny
Gemini Omni Flash całkowicie zmienia podejście do postprodukcji wideo. Użytkownik nie musi korzystać ze skomplikowanych osi czasu ani oprogramowania edycyjnego – wystarczy, że za pomocą języka naturalnego wyda modelowi polecenie modyfikacji nagranego wcześniej filmu. System potrafi m.in. zmieniać pojedyncze obiekty w inne (np. rzeźbę w bańki mydlane), dodawać nowe postacie, modyfikować bieg akcji czy płynnie zmieniać kąty widzenia kamery i styl całego kadru.
Co kluczowe z punktu widzenia inżynierii obrazu, każda kolejna instrukcja stanowi logiczne rozwinięcie poprzedniej. Model charakteryzuje się głębokim, intuicyjnym rozumieniem praw fizyki, takich jak grawitacja, energia kinetyczna czy dynamika płynów. Dzięki temu modyfikowane sceny zachowują pełną spójność strukturalną, postacie nie deformują się, a układ elementów w kadrze pozostaje stabilny w kolejnych sekwencjach.
Urzeczywistnianie pomysłów na podstawie wiedzy o świecie
Dzięki integracji z bazą wiedzy Gemini, model Omni potrafi wykraczać poza proste odtwarzanie wizualnych schematów. Na podstawie krótkiego zapytania tekstowego system potrafi wygenerować materiał o wysokim stopniu skomplikowania merytorycznego – na przykład wierną naukowo animację poklatkową tłumaczącą fałdowanie białek, stylizowaną na film z plasteliny.
Narzędzie potrafi również miksować ze sobą zupełnie skrajne formaty wejściowe (zasada „any-to-any”). Użytkownik może wgrać statyczny plik graficzny (jako referencję stylu), plik wideo (jako referencję ruchu) oraz plik audio (jako tło muzyczne), a Gemini Omni Flash połączy te elementy w jeden spójny, zsynchronizowany z rytmem muzyki klip.
Cyfrowe awatary, bezpieczeństwo i dostępność
W ramach odpowiedzialnego rozwoju technologii, Google wprowadza funkcję tworzenia filmów z własnym cyfrowym awatarem, który potrafi posługiwać się sklonowanym głosem użytkownika. Zaawansowane funkcje edycji mowy są obecnie intensywnie testowane pod kątem bezpieczeństwa.
Aby zapobiec nadużyciom i ułatwić identyfikację syntetycznych materiałów, każdy film wygenerowany przez Gemini Omni Flash zostaje automatycznie opatrzony niewidocznym dla ludzkiego oka cyfrowym znakiem wodnym SynthID oraz metadanymi identyfikacyjnymi standardu C2PA. Pozwala to na natychmiastowe zweryfikowanie pochodzenia filmu z poziomu wyszukiwarki Google czy przeglądarki Chrome.
Model Gemini Omni Flash debiutuje dzisiaj globalnie dla subskrybentów planów Google AI Pro oraz Ultra w aplikacji Gemini i platformie Google Flow. W najbliższych dniach funkcja zostanie udostępniona bezpłatnie użytkownikom w sekcjach YouTube Shorts oraz aplikacji YouTube Create, natomiast deweloperzy otrzymają dostęp do interfejsów API w nadchodzących tygodniach.
#AI #edycjaWideo #GeminiOmni #GeminiOmniFlash #generatorWideo #Google #GoogleIO2026 #iMagazine #SynthID #sztucznaInteligencja #technologia -
Google presenta Gemini Omni Flash: la IA que ahora puede crear y editar videos con solo hablarle https://www.enter.co/chips-bits/google-presenta-gemini-omni-flash-la-ia-que-ahora-puede-crear-y-editar-videos-con-solo-hablarle/?utm_source=dlvr.it&utm_medium=mastodon #Tecnología #edicióndevideo #GeminiOmniFlash
-
Google presenta Gemini Omni Flash: la IA que ahora puede crear y editar videos con solo hablarle https://www.enter.co/chips-bits/google-presenta-gemini-omni-flash-la-ia-que-ahora-puede-crear-y-editar-videos-con-solo-hablarle/?utm_source=dlvr.it&utm_medium=mastodon #Tecnología #edicióndevideo #GeminiOmniFlash