#gemini-omni — Public Fediverse posts on home.social

PPC Land @[email protected] · 2026-05-20 · 16:40 UTC

Asset Studio gets Gemini Omni and 1-click creative testing at GML 2026: Google today expanded Asset Studio with Gemini Omni multimodal video, natural language briefs, and 1-Click Creative Testing, rolling out globally this summer. https://ppc.land/asset-studio-gets-gemini-omni-and-1-click-creative-testing-at-gml-2026/ #AssetStudio #GeminiOmni #CreativeTesting #GoogleGML2026 #VideoMarketing

#assetstudio #geminiomni #creativetesting #googlegml2026 #videomarketing

PPC Land @[email protected] · 2026-05-20 · 16:40 UTC

Asset Studio gets Gemini Omni and 1-click creative testing at GML 2026: Google today expanded Asset Studio with Gemini Omni multimodal video, natural language briefs, and 1-Click Creative Testing, rolling out globally this summer. https://ppc.land/asset-studio-gets-gemini-omni-and-1-click-creative-testing-at-gml-2026/ #AssetStudio #GeminiOmni #CreativeTesting #GoogleGML2026 #VideoMarketing

#videomarketing #googlegml2026 #creativetesting #geminiomni #assetstudio

PPC Land @[email protected] · 2026-05-20 · 16:40 UTC

Asset Studio gets Gemini Omni and 1-click creative testing at GML 2026: Google today expanded Asset Studio with Gemini Omni multimodal video, natural language briefs, and 1-Click Creative Testing, rolling out globally this summer. https://ppc.land/asset-studio-gets-gemini-omni-and-1-click-creative-testing-at-gml-2026/ #AssetStudio #GeminiOmni #CreativeTesting #GoogleGML2026 #VideoMarketing

#assetstudio #geminiomni #creativetesting #googlegml2026 #videomarketing

Andrii Kuznietsov @[email protected] · 2026-05-20 · 14:35 UTC

🤖🎦 Нова модель генерації відео #GeminiOmni, анонсована на Google I/O 2026, з'явиться на #YouTube як інструмент для реміксів Shorts. На додачу, стримінгова платформа отримає розумний пошук, подібний до AI Mode, що вже працює в пошуковій системі Google.

#geminiomni #youtube

Andrii Kuznietsov @[email protected] · 2026-05-20 · 14:35 UTC

🤖🎦 Нова модель генерації відео #GeminiOmni, анонсована на Google I/O 2026, з'явиться на #YouTube як інструмент для реміксів Shorts. На додачу, стримінгова платформа отримає розумний пошук, подібний до AI Mode, що вже працює в пошуковій системі Google.

#geminiomni #youtube

Andrii Kuznietsov @[email protected] · 2026-05-20 · 14:35 UTC

🤖🎦 Нова модель генерації відео #GeminiOmni, анонсована на Google I/O 2026, з'явиться на #YouTube як інструмент для реміксів Shorts. На додачу, стримінгова платформа отримає розумний пошук, подібний до AI Mode, що вже працює в пошуковій системі Google.

#geminiomni #youtube

Andrii Kuznietsov @[email protected] · 2026-05-20 · 14:35 UTC

🤖🎦 Нова модель генерації відео #GeminiOmni, анонсована на Google I/O 2026, з'явиться на #YouTube як інструмент для реміксів Shorts. На додачу, стримінгова платформа отримає розумний пошук, подібний до AI Mode, що вже працює в пошуковій системі Google.

#youtube #geminiomni

România @[email protected] · 2026-05-20 · 12:40 UTC

https://www.europesays.com/ro/184522/ Gemini Omni: noul motor creativ Google pentru generarea de video, design, imagini și muzică #GeminiOmni #google #GoogleFlow #GoogleI/o2026 #GooglePics #RO #Română #Romania #Romanian #synthid #Technology #tehnologie #VideoAi

#videoai #tehnologie #technology #synthid #romanian #romania

:rss: Qiita - 人気の記事 @[email protected] · 2026-05-20 · 12:12 UTC

Gemini Omniを使ってみた【Gemini 3.5 Flash】
https://qiita.com/mikaka/items/4e900383576636d63968?utm_campaign=popular_items&utm_medium=feed&utm_source=popular_items

#qiita #初心者 #AI #Gemini #Seedance2_0 #GeminiOmni

#qiita #初心者 #ai #gemini #seedance2_0 #geminiomni

:rss: Qiita - 人気の記事 @[email protected] · 2026-05-20 · 12:12 UTC

Gemini Omniを使ってみた【Gemini 3.5 Flash】
https://qiita.com/mikaka/items/4e900383576636d63968?utm_campaign=popular_items&utm_medium=feed&utm_source=popular_items

#qiita #初心者 #AI #Gemini #Seedance2_0 #GeminiOmni

#qiita #初心者 #ai #gemini #seedance2_0 #geminiomni

United Kingdom News Beep @[email protected] · 2026-05-20 · 11:00 UTC

‘Ask YouTube’ brings AI-powered conversational search to video, adds Gemini Omni to Shorts

Google is completely revamping its search experience, and that doesn’t stop at YouTube. Like the rest of Google,…
#NewsBeep #News #Technology #GB #geminiomni #GoogleI/O #GoogleI/O2026 #UK #UnitedKingdom #YouTube #YouTubeShorts
https://www.newsbeep.com/uk/594136/

#youtubeshorts #youtube #unitedkingdom #uk #googlei #geminiomni

United States News Beep @[email protected] · 2026-05-20 · 10:20 UTC

‘Ask YouTube’ brings AI-powered conversational search to video, adds Gemini Omni to Shorts

Google is completely revamping its search experience, and that doesn’t stop at YouTube. Like the rest of Google,…
#NewsBeep #News #US #USA #UnitedStates #UnitedStatesOfAmerica #Technology #geminiomni #GoogleI/O #GoogleI/O2026 #YouTube #YouTubeShorts
https://www.newsbeep.com/us/654191/

#newsbeep #news #us #usa #unitedstates #unitedstatesofamerica

United States News Beep @[email protected] · 2026-05-20 · 10:20 UTC

‘Ask YouTube’ brings AI-powered conversational search to video, adds Gemini Omni to Shorts

Google is completely revamping its search experience, and that doesn’t stop at YouTube. Like the rest of Google,…
#NewsBeep #News #US #USA #UnitedStates #UnitedStatesOfAmerica #Technology #geminiomni #GoogleI/O #GoogleI/O2026 #YouTube #YouTubeShorts
https://www.newsbeep.com/us/654191/

#youtubeshorts #youtube #googlei #geminiomni #technology #unitedstatesofamerica

Australia News Beep @[email protected] · 2026-05-20 · 10:00 UTC

Omni wave incoming: Google’s new video model, new AI search interface and agents everywhere

Google has returned fire at its AI competitors with an impressive array of announcements and launches at its…
#NewsBeep #News #Artificialintelligence #AI #ArtificialIntelligence #AU #Australia #GeminiOmni #GoogleGemini #GoogleI/O #PaulHewett #Technology #VinneSchiffersteinVidal
https://www.newsbeep.com/au/682669/

#newsbeep #news #artificialintelligence #ai #au #australia

Australia News Beep @[email protected] · 2026-05-20 · 10:00 UTC

Omni wave incoming: Google’s new video model, new AI search interface and agents everywhere

Google has returned fire at its AI competitors with an impressive array of announcements and launches at its…
#NewsBeep #News #Artificialintelligence #AI #ArtificialIntelligence #AU #Australia #GeminiOmni #GoogleGemini #GoogleI/O #PaulHewett #Technology #VinneSchiffersteinVidal
https://www.newsbeep.com/au/682669/

#vinneschiffersteinvidal #technology #paulhewett #googlei #googlegemini #geminiomni

UK @[email protected] · 2026-05-20 · 09:33 UTC

https://www.europesays.com/uk/972972/ ‘Ask YouTube’ brings AI-powered conversational search to video, adds Gemini Omni to Shorts #GeminiOmni #GoogleI/O #GoogleI/O2026 #Technology #UK #UnitedKingdom #YouTube #YouTubeShorts

#youtubeshorts #youtube #unitedkingdom #uk #technology #googlei

People @[email protected] · 2026-05-20 · 09:07 UTC

https://www.europesays.com/people/78599/ Google Declares ‘AI for Everyone’ Era with Gemini 3.5 Flash #AIAgent #AnthropicCompetition #GeminiOmni #GeminiSpark #GoogleGemini35Flash #GoogleI/O2026 #OpenAICompetition #SundarPichai

#sundarpichai #openaicompetition #googlei #googlegemini35flash #geminispark #geminiomni

Winbuzzer @[email protected] · 2026-05-20 · 08:47 UTC

https://winbuzzer.com/2026/05/20/google-adds-a-conversational-search-feature-to-you-xcxwbn/

YouTube is launching Ask YouTube as a conversational video search feature while adding Gemini Omni remixing into Shorts Remix and the YouTube Create app.

#AI #YouTube #Google #AskYouTube #GoogleGemini #GenAI #AISearch #MultimodalAI #GeminiOmni

#ai #youtube #google #askyoutube #googlegemini #genai

Winbuzzer @[email protected] · 2026-05-20 · 08:47 UTC

https://winbuzzer.com/2026/05/20/google-adds-a-conversational-search-feature-to-you-xcxwbn/

YouTube is launching Ask YouTube as a conversational video search feature while adding Gemini Omni remixing into Shorts Remix and the YouTube Create app.

#AI #YouTube #Google #AskYouTube #GoogleGemini #GenAI #AISearch #MultimodalAI #GeminiOmni

#ai #youtube #google #askyoutube #googlegemini #genai

Winbuzzer @[email protected] · 2026-05-20 · 08:47 UTC

https://winbuzzer.com/2026/05/20/google-adds-a-conversational-search-feature-to-you-xcxwbn/

YouTube is launching Ask YouTube as a conversational video search feature while adding Gemini Omni remixing into Shorts Remix and the YouTube Create app.

#AI #YouTube #Google #AskYouTube #GoogleGemini #GenAI #AISearch #MultimodalAI #GeminiOmni

#ai #youtube #google #askyoutube #googlegemini #genai

Winbuzzer @[email protected] · 2026-05-20 · 08:47 UTC

https://winbuzzer.com/2026/05/20/google-adds-a-conversational-search-feature-to-you-xcxwbn/

YouTube is launching Ask YouTube as a conversational video search feature while adding Gemini Omni remixing into Shorts Remix and the YouTube Create app.

#AI #YouTube #Google #AskYouTube #GoogleGemini #GenAI #AISearch #MultimodalAI #GeminiOmni

#geminiomni #multimodalai #aisearch #genai #googlegemini #askyoutube

Winbuzzer @[email protected] · 2026-05-20 · 08:47 UTC

https://winbuzzer.com/2026/05/20/google-adds-a-conversational-search-feature-to-you-xcxwbn/

YouTube is launching Ask YouTube as a conversational video search feature while adding Gemini Omni remixing into Shorts Remix and the YouTube Create app.

#AI #YouTube #Google #AskYouTube #GoogleGemini #GenAI #AISearch #MultimodalAI #GeminiOmni

#ai #youtube #google #askyoutube #googlegemini #genai

Winbuzzer @[email protected] · 2026-05-20 · 08:35 UTC

https://winbuzzer.com/2026/05/20/google-launches-the-gemini-omni-multimodal-model-s-xcxwbn/

Google has launched Gemini Omni as a mixed-input AI model family and started the first live rollout through Gemini Omni Flash on Gemini, YouTube, and creator surfaces.

#AI #GoogleGemini #Google #GeminiOmni #GoogleAI #GoogleDeepMind #MultimodalAI #AIModels #AIVideoGeneration #AIVideo #TextToVideo #GenAI

#ai #googlegemini #google #geminiomni #googleai #googledeepmind

Winbuzzer @[email protected] · 2026-05-20 · 08:35 UTC

https://winbuzzer.com/2026/05/20/google-launches-the-gemini-omni-multimodal-model-s-xcxwbn/

Google has launched Gemini Omni as a mixed-input AI model family and started the first live rollout through Gemini Omni Flash on Gemini, YouTube, and creator surfaces.

#AI #GoogleGemini #Google #GeminiOmni #GoogleAI #GoogleDeepMind #MultimodalAI #AIModels #AIVideoGeneration #AIVideo #TextToVideo #GenAI

#ai #googlegemini #google #geminiomni #googleai #googledeepmind

Winbuzzer @[email protected] · 2026-05-20 · 08:35 UTC

https://winbuzzer.com/2026/05/20/google-launches-the-gemini-omni-multimodal-model-s-xcxwbn/

Google has launched Gemini Omni as a mixed-input AI model family and started the first live rollout through Gemini Omni Flash on Gemini, YouTube, and creator surfaces.

#AI #GoogleGemini #Google #GeminiOmni #GoogleAI #GoogleDeepMind #MultimodalAI #AIModels #AIVideoGeneration #AIVideo #TextToVideo #GenAI

#ai #googlegemini #google #geminiomni #googleai #googledeepmind

Winbuzzer @[email protected] · 2026-05-20 · 08:35 UTC

https://winbuzzer.com/2026/05/20/google-launches-the-gemini-omni-multimodal-model-s-xcxwbn/

Google has launched Gemini Omni as a mixed-input AI model family and started the first live rollout through Gemini Omni Flash on Gemini, YouTube, and creator surfaces.

#AI #GoogleGemini #Google #GeminiOmni #GoogleAI #GoogleDeepMind #MultimodalAI #AIModels #AIVideoGeneration #AIVideo #TextToVideo #GenAI

#genai #texttovideo #aivideo #aivideogeneration #aimodels #multimodalai

Winbuzzer @[email protected] · 2026-05-20 · 08:35 UTC

https://winbuzzer.com/2026/05/20/google-launches-the-gemini-omni-multimodal-model-s-xcxwbn/

Google has launched Gemini Omni as a mixed-input AI model family and started the first live rollout through Gemini Omni Flash on Gemini, YouTube, and creator surfaces.

#AI #GoogleGemini #Google #GeminiOmni #GoogleAI #GoogleDeepMind #MultimodalAI #AIModels #AIVideoGeneration #AIVideo #TextToVideo #GenAI

#ai #googlegemini #google #geminiomni #googleai #googledeepmind

GadgetFlux @[email protected] · 2026-05-20 · 08:14 UTC

#YouTube takes it to the next level with #AskYouTube and #GeminiOmni

https://gadgetflux.eu/youtube-lanseaza-ask-youtube-si-gemini-omni-ai/

#youtube #askyoutube #geminiomni

mymobprice @[email protected] · 2026-05-20 · 08:08 UTC

Google unveils Gemini 3.5 Flash and Gemini Omni, bringing faster AI performance, advanced coding abilities, and realistic AI video generation tools.

#mymobprice #GoogleGemini #Gemini35Flash #GeminiOmni #ArtificialIntelligence #AIVideoGeneration

https://mymobprice.com/google-launches-gemini-3-5-flash-and-gemini-omni/

#mymobprice #googlegemini #gemini35flash #geminiomni #artificialintelligence #aivideogeneration

mymobprice @[email protected] · 2026-05-20 · 08:08 UTC

Google unveils Gemini 3.5 Flash and Gemini Omni, bringing faster AI performance, advanced coding abilities, and realistic AI video generation tools.

#mymobprice #GoogleGemini #Gemini35Flash #GeminiOmni #ArtificialIntelligence #AIVideoGeneration

https://mymobprice.com/google-launches-gemini-3-5-flash-and-gemini-omni/

#mymobprice #googlegemini #gemini35flash #geminiomni #artificialintelligence #aivideogeneration

mymobprice @[email protected] · 2026-05-20 · 08:08 UTC

Google unveils Gemini 3.5 Flash and Gemini Omni, bringing faster AI performance, advanced coding abilities, and realistic AI video generation tools.

#mymobprice #GoogleGemini #Gemini35Flash #GeminiOmni #ArtificialIntelligence #AIVideoGeneration

https://mymobprice.com/google-launches-gemini-3-5-flash-and-gemini-omni/

#mymobprice #googlegemini #gemini35flash #geminiomni #artificialintelligence #aivideogeneration

mymobprice @[email protected] · 2026-05-20 · 08:08 UTC

Google unveils Gemini 3.5 Flash and Gemini Omni, bringing faster AI performance, advanced coding abilities, and realistic AI video generation tools.

#mymobprice #GoogleGemini #Gemini35Flash #GeminiOmni #ArtificialIntelligence #AIVideoGeneration

https://mymobprice.com/google-launches-gemini-3-5-flash-and-gemini-omni/

#aivideogeneration #artificialintelligence #geminiomni #gemini35flash #googlegemini #mymobprice

mymobprice @[email protected] · 2026-05-20 · 08:08 UTC

Google unveils Gemini 3.5 Flash and Gemini Omni, bringing faster AI performance, advanced coding abilities, and realistic AI video generation tools.

#mymobprice #GoogleGemini #Gemini35Flash #GeminiOmni #ArtificialIntelligence #AIVideoGeneration

https://mymobprice.com/google-launches-gemini-3-5-flash-and-gemini-omni/

#mymobprice #googlegemini #gemini35flash #geminiomni #artificialintelligence #aivideogeneration

Agnieszka Serafinowicz @[email protected] · 2026-05-20 · 06:00 UTC

Google I/O 2026: aplikacja Gemini zyskuje potężne funkcje. Nowy design, codzienne podsumowania i aplikacja na macOS

Aplikacja Gemini w ciągu zaledwie roku przeszła gigantyczną metamorfozę, zdobywając ponad 900 milionów aktywnych użytkowników miesięcznie.

Podczas Google I/O 2026 zaprezentowano pakiet nowości, który zmienia Gemini z pasywnego czatbota w proaktywnego agenta potrafiącego planować nasz dzień, zarządzać zadaniami w tle i tworzyć kinowe materiały wideo.

Oto szczegóły najważniejszych funkcji, które trafiają do konsumentów.

Neural Expressive: koniec ze „ścianami tekstu”

Google całkowicie przeprojektowało interfejs swojej aplikacji, wprowadzając język projektowania o nazwie Neural Expressive. Charakteryzuje się on płynnymi animacjami, nowoczesną typografią oraz haptyczną informacją zwrotną. Najważniejsza zmiana zaszła jednak w sposobie prezentacji danych. Zamiast męczących bloków litego tekstu, Gemini generuje teraz odpowiedzi wzbogacone o interaktywne osie czasu, dynamiczne grafiki oraz krótkie filmy z narracją.

Zmodernizowano również obsługę głosową (funkcja Gemini Live). System potrafi teraz płynnie przechodzić z trybu wpisywania tekstu do swobodnej konwersacji. Co ważne, poprawiono analizę mowy – asystent nie przerywa słuchania, gdy użytkownik robi naturalne pauzy czy wtrąca słowa namysłu, pozwalając na niespieszne dyktowanie złożonych myśli. Nowy interfejs jest udostępniany globalnie od dzisiaj.

Daily Brief i Gemini Spark, czyli AI pracuje za Ciebie

Prawdziwym technologicznym przełomem jest przekazanie modelom AI sprawczości w zarządzaniu naszym czasem. Służą do tego dwa nowe, zintegrowane rozwiązania:

Daily Brief: to nowy, proaktywny agent, którego zadaniem jest przygotowanie spersonalizowanego, porannego raportu. Działając w tle (po uzyskaniu wyraźnej zgody), system analizuje e-maile, kalendarze oraz powiadomienia, a następnie serwuje zwięzłe podsumowanie najważniejszych zadań na dany dzień, sugerując jednocześnie optymalne kroki do podjęcia.
Gemini Spark: ten osobisty agent AI potrafi działać w chmurze 24 godziny na dobę, nawet gdy zamkniesz laptopa lub wyłączysz telefon. Potrafi uczyć się powtarzalnych zadań – możesz zlecić mu m.in. comiesięczną analizę wyciągów z kart kredytowych w poszukiwaniu ukrytych subskrypcji, czy automatyczne tworzenie dopracowanych notatek z wielu rozproszonych wątków e-mail.

Wkrótce Spark zyska obsługę zewnętrznych partnerów (m.in. Canva czy OpenTable), co pozwoli mu wykonywać zadania poza ekosystemem Google. System działa pod pełną kontrolą użytkownika i każdorazowo wymaga autoryzacji przed dokonaniem transakcji finansowej lub wysłaniem wiadomości.

Tworzenie wideo z Gemini Omni i nowa aplikacja dla Maca

Do aplikacji Gemini dla subskrybentów planów Plus, Pro i Ultra trafia również potężny model Gemini Omni. Pozwala on na błyskawiczne generowanie wysokiej jakości klipów wideo na podstawie tekstu, zdjęć i innych filmów. Edycja materiału odbywa się poprzez wydawanie naturalnych poleceń (np. zmiany tła czy zbliżenia kamery), bez konieczności używania skomplikowanych programów montażowych.

Na koniec Google zapowiedziało potężną aktualizację dedykowanej aplikacji Gemini na system macOS (sama aplikacja jest już dostępna do pobrania). Latem tego roku program zostanie zintegrowany z agentem Spark, co pozwoli mu na lokalną pracę z plikami na dysku komputera oraz automatyzację rutynowych procesów z wykorzystaniem kontekstu widocznego bezpośrednio na ekranie.

#AI #aplikacjaGemini #asystentGłosowy #DailyBrief #Gemini #GeminiOmni #GeminiSpark #Google #GoogleIO2026 #iMagazine #macOS #sztucznaInteligencja #technologia

#ai #aplikacjagemini #asystentglosowy #dailybrief #gemini #geminiomni

Agnieszka Serafinowicz @[email protected] · 2026-05-20 · 06:00 UTC

Google I/O 2026: aplikacja Gemini zyskuje potężne funkcje. Nowy design, codzienne podsumowania i aplikacja na macOS

Aplikacja Gemini w ciągu zaledwie roku przeszła gigantyczną metamorfozę, zdobywając ponad 900 milionów aktywnych użytkowników miesięcznie.

Podczas Google I/O 2026 zaprezentowano pakiet nowości, który zmienia Gemini z pasywnego czatbota w proaktywnego agenta potrafiącego planować nasz dzień, zarządzać zadaniami w tle i tworzyć kinowe materiały wideo.

Oto szczegóły najważniejszych funkcji, które trafiają do konsumentów.

Neural Expressive: koniec ze „ścianami tekstu”

Google całkowicie przeprojektowało interfejs swojej aplikacji, wprowadzając język projektowania o nazwie Neural Expressive. Charakteryzuje się on płynnymi animacjami, nowoczesną typografią oraz haptyczną informacją zwrotną. Najważniejsza zmiana zaszła jednak w sposobie prezentacji danych. Zamiast męczących bloków litego tekstu, Gemini generuje teraz odpowiedzi wzbogacone o interaktywne osie czasu, dynamiczne grafiki oraz krótkie filmy z narracją.

Zmodernizowano również obsługę głosową (funkcja Gemini Live). System potrafi teraz płynnie przechodzić z trybu wpisywania tekstu do swobodnej konwersacji. Co ważne, poprawiono analizę mowy – asystent nie przerywa słuchania, gdy użytkownik robi naturalne pauzy czy wtrąca słowa namysłu, pozwalając na niespieszne dyktowanie złożonych myśli. Nowy interfejs jest udostępniany globalnie od dzisiaj.

Daily Brief i Gemini Spark, czyli AI pracuje za Ciebie

Prawdziwym technologicznym przełomem jest przekazanie modelom AI sprawczości w zarządzaniu naszym czasem. Służą do tego dwa nowe, zintegrowane rozwiązania:

Daily Brief: to nowy, proaktywny agent, którego zadaniem jest przygotowanie spersonalizowanego, porannego raportu. Działając w tle (po uzyskaniu wyraźnej zgody), system analizuje e-maile, kalendarze oraz powiadomienia, a następnie serwuje zwięzłe podsumowanie najważniejszych zadań na dany dzień, sugerując jednocześnie optymalne kroki do podjęcia.
Gemini Spark: ten osobisty agent AI potrafi działać w chmurze 24 godziny na dobę, nawet gdy zamkniesz laptopa lub wyłączysz telefon. Potrafi uczyć się powtarzalnych zadań – możesz zlecić mu m.in. comiesięczną analizę wyciągów z kart kredytowych w poszukiwaniu ukrytych subskrypcji, czy automatyczne tworzenie dopracowanych notatek z wielu rozproszonych wątków e-mail.

Wkrótce Spark zyska obsługę zewnętrznych partnerów (m.in. Canva czy OpenTable), co pozwoli mu wykonywać zadania poza ekosystemem Google. System działa pod pełną kontrolą użytkownika i każdorazowo wymaga autoryzacji przed dokonaniem transakcji finansowej lub wysłaniem wiadomości.

Tworzenie wideo z Gemini Omni i nowa aplikacja dla Maca

Do aplikacji Gemini dla subskrybentów planów Plus, Pro i Ultra trafia również potężny model Gemini Omni. Pozwala on na błyskawiczne generowanie wysokiej jakości klipów wideo na podstawie tekstu, zdjęć i innych filmów. Edycja materiału odbywa się poprzez wydawanie naturalnych poleceń (np. zmiany tła czy zbliżenia kamery), bez konieczności używania skomplikowanych programów montażowych.

Na koniec Google zapowiedziało potężną aktualizację dedykowanej aplikacji Gemini na system macOS (sama aplikacja jest już dostępna do pobrania). Latem tego roku program zostanie zintegrowany z agentem Spark, co pozwoli mu na lokalną pracę z plikami na dysku komputera oraz automatyzację rutynowych procesów z wykorzystaniem kontekstu widocznego bezpośrednio na ekranie.

#AI #aplikacjaGemini #asystentGłosowy #DailyBrief #Gemini #GeminiOmni #GeminiSpark #Google #GoogleIO2026 #iMagazine #macOS #sztucznaInteligencja #technologia

#ai #aplikacjagemini #asystentglosowy #dailybrief #gemini #geminiomni

Agnieszka Serafinowicz @[email protected] · 2026-05-20 · 06:00 UTC

Google I/O 2026: aplikacja Gemini zyskuje potężne funkcje. Nowy design, codzienne podsumowania i aplikacja na macOS

Aplikacja Gemini w ciągu zaledwie roku przeszła gigantyczną metamorfozę, zdobywając ponad 900 milionów aktywnych użytkowników miesięcznie.

Podczas Google I/O 2026 zaprezentowano pakiet nowości, który zmienia Gemini z pasywnego czatbota w proaktywnego agenta potrafiącego planować nasz dzień, zarządzać zadaniami w tle i tworzyć kinowe materiały wideo.

Oto szczegóły najważniejszych funkcji, które trafiają do konsumentów.

Neural Expressive: koniec ze „ścianami tekstu”

Google całkowicie przeprojektowało interfejs swojej aplikacji, wprowadzając język projektowania o nazwie Neural Expressive. Charakteryzuje się on płynnymi animacjami, nowoczesną typografią oraz haptyczną informacją zwrotną. Najważniejsza zmiana zaszła jednak w sposobie prezentacji danych. Zamiast męczących bloków litego tekstu, Gemini generuje teraz odpowiedzi wzbogacone o interaktywne osie czasu, dynamiczne grafiki oraz krótkie filmy z narracją.

Zmodernizowano również obsługę głosową (funkcja Gemini Live). System potrafi teraz płynnie przechodzić z trybu wpisywania tekstu do swobodnej konwersacji. Co ważne, poprawiono analizę mowy – asystent nie przerywa słuchania, gdy użytkownik robi naturalne pauzy czy wtrąca słowa namysłu, pozwalając na niespieszne dyktowanie złożonych myśli. Nowy interfejs jest udostępniany globalnie od dzisiaj.

Daily Brief i Gemini Spark, czyli AI pracuje za Ciebie

Prawdziwym technologicznym przełomem jest przekazanie modelom AI sprawczości w zarządzaniu naszym czasem. Służą do tego dwa nowe, zintegrowane rozwiązania:

Daily Brief: to nowy, proaktywny agent, którego zadaniem jest przygotowanie spersonalizowanego, porannego raportu. Działając w tle (po uzyskaniu wyraźnej zgody), system analizuje e-maile, kalendarze oraz powiadomienia, a następnie serwuje zwięzłe podsumowanie najważniejszych zadań na dany dzień, sugerując jednocześnie optymalne kroki do podjęcia.
Gemini Spark: ten osobisty agent AI potrafi działać w chmurze 24 godziny na dobę, nawet gdy zamkniesz laptopa lub wyłączysz telefon. Potrafi uczyć się powtarzalnych zadań – możesz zlecić mu m.in. comiesięczną analizę wyciągów z kart kredytowych w poszukiwaniu ukrytych subskrypcji, czy automatyczne tworzenie dopracowanych notatek z wielu rozproszonych wątków e-mail.

Wkrótce Spark zyska obsługę zewnętrznych partnerów (m.in. Canva czy OpenTable), co pozwoli mu wykonywać zadania poza ekosystemem Google. System działa pod pełną kontrolą użytkownika i każdorazowo wymaga autoryzacji przed dokonaniem transakcji finansowej lub wysłaniem wiadomości.

Tworzenie wideo z Gemini Omni i nowa aplikacja dla Maca

Do aplikacji Gemini dla subskrybentów planów Plus, Pro i Ultra trafia również potężny model Gemini Omni. Pozwala on na błyskawiczne generowanie wysokiej jakości klipów wideo na podstawie tekstu, zdjęć i innych filmów. Edycja materiału odbywa się poprzez wydawanie naturalnych poleceń (np. zmiany tła czy zbliżenia kamery), bez konieczności używania skomplikowanych programów montażowych.

Na koniec Google zapowiedziało potężną aktualizację dedykowanej aplikacji Gemini na system macOS (sama aplikacja jest już dostępna do pobrania). Latem tego roku program zostanie zintegrowany z agentem Spark, co pozwoli mu na lokalną pracę z plikami na dysku komputera oraz automatyzację rutynowych procesów z wykorzystaniem kontekstu widocznego bezpośrednio na ekranie.

#AI #aplikacjaGemini #asystentGłosowy #DailyBrief #Gemini #GeminiOmni #GeminiSpark #Google #GoogleIO2026 #iMagazine #macOS #sztucznaInteligencja #technologia

#ai #aplikacjagemini #asystentglosowy #dailybrief #gemini #geminiomni

Agnieszka Serafinowicz @[email protected] · 2026-05-20 · 06:00 UTC

Google I/O 2026: aplikacja Gemini zyskuje potężne funkcje. Nowy design, codzienne podsumowania i aplikacja na macOS

Aplikacja Gemini w ciągu zaledwie roku przeszła gigantyczną metamorfozę, zdobywając ponad 900 milionów aktywnych użytkowników miesięcznie.

Podczas Google I/O 2026 zaprezentowano pakiet nowości, który zmienia Gemini z pasywnego czatbota w proaktywnego agenta potrafiącego planować nasz dzień, zarządzać zadaniami w tle i tworzyć kinowe materiały wideo.

Oto szczegóły najważniejszych funkcji, które trafiają do konsumentów.

Neural Expressive: koniec ze „ścianami tekstu”

Google całkowicie przeprojektowało interfejs swojej aplikacji, wprowadzając język projektowania o nazwie Neural Expressive. Charakteryzuje się on płynnymi animacjami, nowoczesną typografią oraz haptyczną informacją zwrotną. Najważniejsza zmiana zaszła jednak w sposobie prezentacji danych. Zamiast męczących bloków litego tekstu, Gemini generuje teraz odpowiedzi wzbogacone o interaktywne osie czasu, dynamiczne grafiki oraz krótkie filmy z narracją.

Zmodernizowano również obsługę głosową (funkcja Gemini Live). System potrafi teraz płynnie przechodzić z trybu wpisywania tekstu do swobodnej konwersacji. Co ważne, poprawiono analizę mowy – asystent nie przerywa słuchania, gdy użytkownik robi naturalne pauzy czy wtrąca słowa namysłu, pozwalając na niespieszne dyktowanie złożonych myśli. Nowy interfejs jest udostępniany globalnie od dzisiaj.

Daily Brief i Gemini Spark, czyli AI pracuje za Ciebie

Prawdziwym technologicznym przełomem jest przekazanie modelom AI sprawczości w zarządzaniu naszym czasem. Służą do tego dwa nowe, zintegrowane rozwiązania:

Daily Brief: to nowy, proaktywny agent, którego zadaniem jest przygotowanie spersonalizowanego, porannego raportu. Działając w tle (po uzyskaniu wyraźnej zgody), system analizuje e-maile, kalendarze oraz powiadomienia, a następnie serwuje zwięzłe podsumowanie najważniejszych zadań na dany dzień, sugerując jednocześnie optymalne kroki do podjęcia.
Gemini Spark: ten osobisty agent AI potrafi działać w chmurze 24 godziny na dobę, nawet gdy zamkniesz laptopa lub wyłączysz telefon. Potrafi uczyć się powtarzalnych zadań – możesz zlecić mu m.in. comiesięczną analizę wyciągów z kart kredytowych w poszukiwaniu ukrytych subskrypcji, czy automatyczne tworzenie dopracowanych notatek z wielu rozproszonych wątków e-mail.

Wkrótce Spark zyska obsługę zewnętrznych partnerów (m.in. Canva czy OpenTable), co pozwoli mu wykonywać zadania poza ekosystemem Google. System działa pod pełną kontrolą użytkownika i każdorazowo wymaga autoryzacji przed dokonaniem transakcji finansowej lub wysłaniem wiadomości.

Tworzenie wideo z Gemini Omni i nowa aplikacja dla Maca

Do aplikacji Gemini dla subskrybentów planów Plus, Pro i Ultra trafia również potężny model Gemini Omni. Pozwala on na błyskawiczne generowanie wysokiej jakości klipów wideo na podstawie tekstu, zdjęć i innych filmów. Edycja materiału odbywa się poprzez wydawanie naturalnych poleceń (np. zmiany tła czy zbliżenia kamery), bez konieczności używania skomplikowanych programów montażowych.

Na koniec Google zapowiedziało potężną aktualizację dedykowanej aplikacji Gemini na system macOS (sama aplikacja jest już dostępna do pobrania). Latem tego roku program zostanie zintegrowany z agentem Spark, co pozwoli mu na lokalną pracę z plikami na dysku komputera oraz automatyzację rutynowych procesów z wykorzystaniem kontekstu widocznego bezpośrednio na ekranie.

#AI #aplikacjaGemini #asystentGłosowy #DailyBrief #Gemini #GeminiOmni #GeminiSpark #Google #GoogleIO2026 #iMagazine #macOS #sztucznaInteligencja #technologia

#technologia #sztucznainteligencja #macos #imagazine #googleio2026 #google

Agnieszka Serafinowicz @[email protected] · 2026-05-20 · 06:00 UTC

Google I/O 2026: aplikacja Gemini zyskuje potężne funkcje. Nowy design, codzienne podsumowania i aplikacja na macOS

Aplikacja Gemini w ciągu zaledwie roku przeszła gigantyczną metamorfozę, zdobywając ponad 900 milionów aktywnych użytkowników miesięcznie.

Podczas Google I/O 2026 zaprezentowano pakiet nowości, który zmienia Gemini z pasywnego czatbota w proaktywnego agenta potrafiącego planować nasz dzień, zarządzać zadaniami w tle i tworzyć kinowe materiały wideo.

Oto szczegóły najważniejszych funkcji, które trafiają do konsumentów.

Neural Expressive: koniec ze „ścianami tekstu”

Google całkowicie przeprojektowało interfejs swojej aplikacji, wprowadzając język projektowania o nazwie Neural Expressive. Charakteryzuje się on płynnymi animacjami, nowoczesną typografią oraz haptyczną informacją zwrotną. Najważniejsza zmiana zaszła jednak w sposobie prezentacji danych. Zamiast męczących bloków litego tekstu, Gemini generuje teraz odpowiedzi wzbogacone o interaktywne osie czasu, dynamiczne grafiki oraz krótkie filmy z narracją.

Zmodernizowano również obsługę głosową (funkcja Gemini Live). System potrafi teraz płynnie przechodzić z trybu wpisywania tekstu do swobodnej konwersacji. Co ważne, poprawiono analizę mowy – asystent nie przerywa słuchania, gdy użytkownik robi naturalne pauzy czy wtrąca słowa namysłu, pozwalając na niespieszne dyktowanie złożonych myśli. Nowy interfejs jest udostępniany globalnie od dzisiaj.

Daily Brief i Gemini Spark, czyli AI pracuje za Ciebie

Prawdziwym technologicznym przełomem jest przekazanie modelom AI sprawczości w zarządzaniu naszym czasem. Służą do tego dwa nowe, zintegrowane rozwiązania:

Daily Brief: to nowy, proaktywny agent, którego zadaniem jest przygotowanie spersonalizowanego, porannego raportu. Działając w tle (po uzyskaniu wyraźnej zgody), system analizuje e-maile, kalendarze oraz powiadomienia, a następnie serwuje zwięzłe podsumowanie najważniejszych zadań na dany dzień, sugerując jednocześnie optymalne kroki do podjęcia.
Gemini Spark: ten osobisty agent AI potrafi działać w chmurze 24 godziny na dobę, nawet gdy zamkniesz laptopa lub wyłączysz telefon. Potrafi uczyć się powtarzalnych zadań – możesz zlecić mu m.in. comiesięczną analizę wyciągów z kart kredytowych w poszukiwaniu ukrytych subskrypcji, czy automatyczne tworzenie dopracowanych notatek z wielu rozproszonych wątków e-mail.

Wkrótce Spark zyska obsługę zewnętrznych partnerów (m.in. Canva czy OpenTable), co pozwoli mu wykonywać zadania poza ekosystemem Google. System działa pod pełną kontrolą użytkownika i każdorazowo wymaga autoryzacji przed dokonaniem transakcji finansowej lub wysłaniem wiadomości.

Tworzenie wideo z Gemini Omni i nowa aplikacja dla Maca

Do aplikacji Gemini dla subskrybentów planów Plus, Pro i Ultra trafia również potężny model Gemini Omni. Pozwala on na błyskawiczne generowanie wysokiej jakości klipów wideo na podstawie tekstu, zdjęć i innych filmów. Edycja materiału odbywa się poprzez wydawanie naturalnych poleceń (np. zmiany tła czy zbliżenia kamery), bez konieczności używania skomplikowanych programów montażowych.

Na koniec Google zapowiedziało potężną aktualizację dedykowanej aplikacji Gemini na system macOS (sama aplikacja jest już dostępna do pobrania). Latem tego roku program zostanie zintegrowany z agentem Spark, co pozwoli mu na lokalną pracę z plikami na dysku komputera oraz automatyzację rutynowych procesów z wykorzystaniem kontekstu widocznego bezpośrednio na ekranie.

#AI #aplikacjaGemini #asystentGłosowy #DailyBrief #Gemini #GeminiOmni #GeminiSpark #Google #GoogleIO2026 #iMagazine #macOS #sztucznaInteligencja #technologia

#ai #aplikacjagemini #asystentglosowy #dailybrief #gemini #geminiomni

Agnieszka Serafinowicz @[email protected] · 2026-05-20 · 05:30 UTC

Google I/O 2026: Gemini Omni Flash oficjalnie. Interaktywna edycja wideo i generowanie treści z dowolnych danych

W zeszłym roku Google udostępniło narzędzie Nano Banana do edycji grafiki, a podczas konferencji Google I/O 2026 przyszedł czas na kolejny krok w rozwoju natywnej multimodalności.

Gigant zaprezentował model Gemini Omni (w pierwszej kolejności wersję Gemini Omni Flash), który łączy zaawansowane wnioskowanie sztucznej inteligencji z możliwością jednoczesnego przetwarzania i generowania obrazów, dźwięków, filmów oraz tekstu. Najważniejszą nowością jest możliwość pełnej edycji materiałów wideo za pomocą zwykłej, swobodnej rozmowy z modelem.

Konwersacyjna edycja wideo i realizm fizyczny

Gemini Omni Flash całkowicie zmienia podejście do postprodukcji wideo. Użytkownik nie musi korzystać ze skomplikowanych osi czasu ani oprogramowania edycyjnego – wystarczy, że za pomocą języka naturalnego wyda modelowi polecenie modyfikacji nagranego wcześniej filmu. System potrafi m.in. zmieniać pojedyncze obiekty w inne (np. rzeźbę w bańki mydlane), dodawać nowe postacie, modyfikować bieg akcji czy płynnie zmieniać kąty widzenia kamery i styl całego kadru.

Co kluczowe z punktu widzenia inżynierii obrazu, każda kolejna instrukcja stanowi logiczne rozwinięcie poprzedniej. Model charakteryzuje się głębokim, intuicyjnym rozumieniem praw fizyki, takich jak grawitacja, energia kinetyczna czy dynamika płynów. Dzięki temu modyfikowane sceny zachowują pełną spójność strukturalną, postacie nie deformują się, a układ elementów w kadrze pozostaje stabilny w kolejnych sekwencjach.

Urzeczywistnianie pomysłów na podstawie wiedzy o świecie

Dzięki integracji z bazą wiedzy Gemini, model Omni potrafi wykraczać poza proste odtwarzanie wizualnych schematów. Na podstawie krótkiego zapytania tekstowego system potrafi wygenerować materiał o wysokim stopniu skomplikowania merytorycznego – na przykład wierną naukowo animację poklatkową tłumaczącą fałdowanie białek, stylizowaną na film z plasteliny.

Narzędzie potrafi również miksować ze sobą zupełnie skrajne formaty wejściowe (zasada „any-to-any”). Użytkownik może wgrać statyczny plik graficzny (jako referencję stylu), plik wideo (jako referencję ruchu) oraz plik audio (jako tło muzyczne), a Gemini Omni Flash połączy te elementy w jeden spójny, zsynchronizowany z rytmem muzyki klip.

Cyfrowe awatary, bezpieczeństwo i dostępność

W ramach odpowiedzialnego rozwoju technologii, Google wprowadza funkcję tworzenia filmów z własnym cyfrowym awatarem, który potrafi posługiwać się sklonowanym głosem użytkownika. Zaawansowane funkcje edycji mowy są obecnie intensywnie testowane pod kątem bezpieczeństwa.

Aby zapobiec nadużyciom i ułatwić identyfikację syntetycznych materiałów, każdy film wygenerowany przez Gemini Omni Flash zostaje automatycznie opatrzony niewidocznym dla ludzkiego oka cyfrowym znakiem wodnym SynthID oraz metadanymi identyfikacyjnymi standardu C2PA. Pozwala to na natychmiastowe zweryfikowanie pochodzenia filmu z poziomu wyszukiwarki Google czy przeglądarki Chrome.

Model Gemini Omni Flash debiutuje dzisiaj globalnie dla subskrybentów planów Google AI Pro oraz Ultra w aplikacji Gemini i platformie Google Flow. W najbliższych dniach funkcja zostanie udostępniona bezpłatnie użytkownikom w sekcjach YouTube Shorts oraz aplikacji YouTube Create, natomiast deweloperzy otrzymają dostęp do interfejsów API w nadchodzących tygodniach.

#AI #edycjaWideo #GeminiOmni #GeminiOmniFlash #generatorWideo #Google #GoogleIO2026 #iMagazine #SynthID #sztucznaInteligencja #technologia

#ai #edycjawideo #geminiomni #geminiomniflash #generatorwideo #google

Agnieszka Serafinowicz @[email protected] · 2026-05-20 · 05:30 UTC

Google I/O 2026: Gemini Omni Flash oficjalnie. Interaktywna edycja wideo i generowanie treści z dowolnych danych

W zeszłym roku Google udostępniło narzędzie Nano Banana do edycji grafiki, a podczas konferencji Google I/O 2026 przyszedł czas na kolejny krok w rozwoju natywnej multimodalności.

Gigant zaprezentował model Gemini Omni (w pierwszej kolejności wersję Gemini Omni Flash), który łączy zaawansowane wnioskowanie sztucznej inteligencji z możliwością jednoczesnego przetwarzania i generowania obrazów, dźwięków, filmów oraz tekstu. Najważniejszą nowością jest możliwość pełnej edycji materiałów wideo za pomocą zwykłej, swobodnej rozmowy z modelem.

Konwersacyjna edycja wideo i realizm fizyczny

Gemini Omni Flash całkowicie zmienia podejście do postprodukcji wideo. Użytkownik nie musi korzystać ze skomplikowanych osi czasu ani oprogramowania edycyjnego – wystarczy, że za pomocą języka naturalnego wyda modelowi polecenie modyfikacji nagranego wcześniej filmu. System potrafi m.in. zmieniać pojedyncze obiekty w inne (np. rzeźbę w bańki mydlane), dodawać nowe postacie, modyfikować bieg akcji czy płynnie zmieniać kąty widzenia kamery i styl całego kadru.

Co kluczowe z punktu widzenia inżynierii obrazu, każda kolejna instrukcja stanowi logiczne rozwinięcie poprzedniej. Model charakteryzuje się głębokim, intuicyjnym rozumieniem praw fizyki, takich jak grawitacja, energia kinetyczna czy dynamika płynów. Dzięki temu modyfikowane sceny zachowują pełną spójność strukturalną, postacie nie deformują się, a układ elementów w kadrze pozostaje stabilny w kolejnych sekwencjach.

Urzeczywistnianie pomysłów na podstawie wiedzy o świecie

Dzięki integracji z bazą wiedzy Gemini, model Omni potrafi wykraczać poza proste odtwarzanie wizualnych schematów. Na podstawie krótkiego zapytania tekstowego system potrafi wygenerować materiał o wysokim stopniu skomplikowania merytorycznego – na przykład wierną naukowo animację poklatkową tłumaczącą fałdowanie białek, stylizowaną na film z plasteliny.

Narzędzie potrafi również miksować ze sobą zupełnie skrajne formaty wejściowe (zasada „any-to-any”). Użytkownik może wgrać statyczny plik graficzny (jako referencję stylu), plik wideo (jako referencję ruchu) oraz plik audio (jako tło muzyczne), a Gemini Omni Flash połączy te elementy w jeden spójny, zsynchronizowany z rytmem muzyki klip.

Cyfrowe awatary, bezpieczeństwo i dostępność

W ramach odpowiedzialnego rozwoju technologii, Google wprowadza funkcję tworzenia filmów z własnym cyfrowym awatarem, który potrafi posługiwać się sklonowanym głosem użytkownika. Zaawansowane funkcje edycji mowy są obecnie intensywnie testowane pod kątem bezpieczeństwa.

Aby zapobiec nadużyciom i ułatwić identyfikację syntetycznych materiałów, każdy film wygenerowany przez Gemini Omni Flash zostaje automatycznie opatrzony niewidocznym dla ludzkiego oka cyfrowym znakiem wodnym SynthID oraz metadanymi identyfikacyjnymi standardu C2PA. Pozwala to na natychmiastowe zweryfikowanie pochodzenia filmu z poziomu wyszukiwarki Google czy przeglądarki Chrome.

Model Gemini Omni Flash debiutuje dzisiaj globalnie dla subskrybentów planów Google AI Pro oraz Ultra w aplikacji Gemini i platformie Google Flow. W najbliższych dniach funkcja zostanie udostępniona bezpłatnie użytkownikom w sekcjach YouTube Shorts oraz aplikacji YouTube Create, natomiast deweloperzy otrzymają dostęp do interfejsów API w nadchodzących tygodniach.

#AI #edycjaWideo #GeminiOmni #GeminiOmniFlash #generatorWideo #Google #GoogleIO2026 #iMagazine #SynthID #sztucznaInteligencja #technologia

#ai #edycjawideo #geminiomni #geminiomniflash #generatorwideo #google

Agnieszka Serafinowicz @[email protected] · 2026-05-20 · 05:30 UTC

Google I/O 2026: Gemini Omni Flash oficjalnie. Interaktywna edycja wideo i generowanie treści z dowolnych danych

W zeszłym roku Google udostępniło narzędzie Nano Banana do edycji grafiki, a podczas konferencji Google I/O 2026 przyszedł czas na kolejny krok w rozwoju natywnej multimodalności.

Gigant zaprezentował model Gemini Omni (w pierwszej kolejności wersję Gemini Omni Flash), który łączy zaawansowane wnioskowanie sztucznej inteligencji z możliwością jednoczesnego przetwarzania i generowania obrazów, dźwięków, filmów oraz tekstu. Najważniejszą nowością jest możliwość pełnej edycji materiałów wideo za pomocą zwykłej, swobodnej rozmowy z modelem.

Konwersacyjna edycja wideo i realizm fizyczny

Gemini Omni Flash całkowicie zmienia podejście do postprodukcji wideo. Użytkownik nie musi korzystać ze skomplikowanych osi czasu ani oprogramowania edycyjnego – wystarczy, że za pomocą języka naturalnego wyda modelowi polecenie modyfikacji nagranego wcześniej filmu. System potrafi m.in. zmieniać pojedyncze obiekty w inne (np. rzeźbę w bańki mydlane), dodawać nowe postacie, modyfikować bieg akcji czy płynnie zmieniać kąty widzenia kamery i styl całego kadru.

Co kluczowe z punktu widzenia inżynierii obrazu, każda kolejna instrukcja stanowi logiczne rozwinięcie poprzedniej. Model charakteryzuje się głębokim, intuicyjnym rozumieniem praw fizyki, takich jak grawitacja, energia kinetyczna czy dynamika płynów. Dzięki temu modyfikowane sceny zachowują pełną spójność strukturalną, postacie nie deformują się, a układ elementów w kadrze pozostaje stabilny w kolejnych sekwencjach.

Urzeczywistnianie pomysłów na podstawie wiedzy o świecie

Dzięki integracji z bazą wiedzy Gemini, model Omni potrafi wykraczać poza proste odtwarzanie wizualnych schematów. Na podstawie krótkiego zapytania tekstowego system potrafi wygenerować materiał o wysokim stopniu skomplikowania merytorycznego – na przykład wierną naukowo animację poklatkową tłumaczącą fałdowanie białek, stylizowaną na film z plasteliny.

Narzędzie potrafi również miksować ze sobą zupełnie skrajne formaty wejściowe (zasada „any-to-any”). Użytkownik może wgrać statyczny plik graficzny (jako referencję stylu), plik wideo (jako referencję ruchu) oraz plik audio (jako tło muzyczne), a Gemini Omni Flash połączy te elementy w jeden spójny, zsynchronizowany z rytmem muzyki klip.

Cyfrowe awatary, bezpieczeństwo i dostępność

W ramach odpowiedzialnego rozwoju technologii, Google wprowadza funkcję tworzenia filmów z własnym cyfrowym awatarem, który potrafi posługiwać się sklonowanym głosem użytkownika. Zaawansowane funkcje edycji mowy są obecnie intensywnie testowane pod kątem bezpieczeństwa.

Aby zapobiec nadużyciom i ułatwić identyfikację syntetycznych materiałów, każdy film wygenerowany przez Gemini Omni Flash zostaje automatycznie opatrzony niewidocznym dla ludzkiego oka cyfrowym znakiem wodnym SynthID oraz metadanymi identyfikacyjnymi standardu C2PA. Pozwala to na natychmiastowe zweryfikowanie pochodzenia filmu z poziomu wyszukiwarki Google czy przeglądarki Chrome.

Model Gemini Omni Flash debiutuje dzisiaj globalnie dla subskrybentów planów Google AI Pro oraz Ultra w aplikacji Gemini i platformie Google Flow. W najbliższych dniach funkcja zostanie udostępniona bezpłatnie użytkownikom w sekcjach YouTube Shorts oraz aplikacji YouTube Create, natomiast deweloperzy otrzymają dostęp do interfejsów API w nadchodzących tygodniach.

#AI #edycjaWideo #GeminiOmni #GeminiOmniFlash #generatorWideo #Google #GoogleIO2026 #iMagazine #SynthID #sztucznaInteligencja #technologia

#ai #edycjawideo #geminiomni #geminiomniflash #generatorwideo #google

Agnieszka Serafinowicz @[email protected] · 2026-05-20 · 05:30 UTC

Google I/O 2026: Gemini Omni Flash oficjalnie. Interaktywna edycja wideo i generowanie treści z dowolnych danych

W zeszłym roku Google udostępniło narzędzie Nano Banana do edycji grafiki, a podczas konferencji Google I/O 2026 przyszedł czas na kolejny krok w rozwoju natywnej multimodalności.

Gigant zaprezentował model Gemini Omni (w pierwszej kolejności wersję Gemini Omni Flash), który łączy zaawansowane wnioskowanie sztucznej inteligencji z możliwością jednoczesnego przetwarzania i generowania obrazów, dźwięków, filmów oraz tekstu. Najważniejszą nowością jest możliwość pełnej edycji materiałów wideo za pomocą zwykłej, swobodnej rozmowy z modelem.

Konwersacyjna edycja wideo i realizm fizyczny

Gemini Omni Flash całkowicie zmienia podejście do postprodukcji wideo. Użytkownik nie musi korzystać ze skomplikowanych osi czasu ani oprogramowania edycyjnego – wystarczy, że za pomocą języka naturalnego wyda modelowi polecenie modyfikacji nagranego wcześniej filmu. System potrafi m.in. zmieniać pojedyncze obiekty w inne (np. rzeźbę w bańki mydlane), dodawać nowe postacie, modyfikować bieg akcji czy płynnie zmieniać kąty widzenia kamery i styl całego kadru.

Co kluczowe z punktu widzenia inżynierii obrazu, każda kolejna instrukcja stanowi logiczne rozwinięcie poprzedniej. Model charakteryzuje się głębokim, intuicyjnym rozumieniem praw fizyki, takich jak grawitacja, energia kinetyczna czy dynamika płynów. Dzięki temu modyfikowane sceny zachowują pełną spójność strukturalną, postacie nie deformują się, a układ elementów w kadrze pozostaje stabilny w kolejnych sekwencjach.

Urzeczywistnianie pomysłów na podstawie wiedzy o świecie

Dzięki integracji z bazą wiedzy Gemini, model Omni potrafi wykraczać poza proste odtwarzanie wizualnych schematów. Na podstawie krótkiego zapytania tekstowego system potrafi wygenerować materiał o wysokim stopniu skomplikowania merytorycznego – na przykład wierną naukowo animację poklatkową tłumaczącą fałdowanie białek, stylizowaną na film z plasteliny.

Narzędzie potrafi również miksować ze sobą zupełnie skrajne formaty wejściowe (zasada „any-to-any”). Użytkownik może wgrać statyczny plik graficzny (jako referencję stylu), plik wideo (jako referencję ruchu) oraz plik audio (jako tło muzyczne), a Gemini Omni Flash połączy te elementy w jeden spójny, zsynchronizowany z rytmem muzyki klip.

Cyfrowe awatary, bezpieczeństwo i dostępność

W ramach odpowiedzialnego rozwoju technologii, Google wprowadza funkcję tworzenia filmów z własnym cyfrowym awatarem, który potrafi posługiwać się sklonowanym głosem użytkownika. Zaawansowane funkcje edycji mowy są obecnie intensywnie testowane pod kątem bezpieczeństwa.

Aby zapobiec nadużyciom i ułatwić identyfikację syntetycznych materiałów, każdy film wygenerowany przez Gemini Omni Flash zostaje automatycznie opatrzony niewidocznym dla ludzkiego oka cyfrowym znakiem wodnym SynthID oraz metadanymi identyfikacyjnymi standardu C2PA. Pozwala to na natychmiastowe zweryfikowanie pochodzenia filmu z poziomu wyszukiwarki Google czy przeglądarki Chrome.

Model Gemini Omni Flash debiutuje dzisiaj globalnie dla subskrybentów planów Google AI Pro oraz Ultra w aplikacji Gemini i platformie Google Flow. W najbliższych dniach funkcja zostanie udostępniona bezpłatnie użytkownikom w sekcjach YouTube Shorts oraz aplikacji YouTube Create, natomiast deweloperzy otrzymają dostęp do interfejsów API w nadchodzących tygodniach.

#AI #edycjaWideo #GeminiOmni #GeminiOmniFlash #generatorWideo #Google #GoogleIO2026 #iMagazine #SynthID #sztucznaInteligencja #technologia

#technologia #sztucznainteligencja #synthid #imagazine #googleio2026 #google

Agnieszka Serafinowicz @[email protected] · 2026-05-20 · 05:30 UTC

Google I/O 2026: Gemini Omni Flash oficjalnie. Interaktywna edycja wideo i generowanie treści z dowolnych danych

W zeszłym roku Google udostępniło narzędzie Nano Banana do edycji grafiki, a podczas konferencji Google I/O 2026 przyszedł czas na kolejny krok w rozwoju natywnej multimodalności.

Gigant zaprezentował model Gemini Omni (w pierwszej kolejności wersję Gemini Omni Flash), który łączy zaawansowane wnioskowanie sztucznej inteligencji z możliwością jednoczesnego przetwarzania i generowania obrazów, dźwięków, filmów oraz tekstu. Najważniejszą nowością jest możliwość pełnej edycji materiałów wideo za pomocą zwykłej, swobodnej rozmowy z modelem.

Konwersacyjna edycja wideo i realizm fizyczny

Gemini Omni Flash całkowicie zmienia podejście do postprodukcji wideo. Użytkownik nie musi korzystać ze skomplikowanych osi czasu ani oprogramowania edycyjnego – wystarczy, że za pomocą języka naturalnego wyda modelowi polecenie modyfikacji nagranego wcześniej filmu. System potrafi m.in. zmieniać pojedyncze obiekty w inne (np. rzeźbę w bańki mydlane), dodawać nowe postacie, modyfikować bieg akcji czy płynnie zmieniać kąty widzenia kamery i styl całego kadru.

Co kluczowe z punktu widzenia inżynierii obrazu, każda kolejna instrukcja stanowi logiczne rozwinięcie poprzedniej. Model charakteryzuje się głębokim, intuicyjnym rozumieniem praw fizyki, takich jak grawitacja, energia kinetyczna czy dynamika płynów. Dzięki temu modyfikowane sceny zachowują pełną spójność strukturalną, postacie nie deformują się, a układ elementów w kadrze pozostaje stabilny w kolejnych sekwencjach.

Urzeczywistnianie pomysłów na podstawie wiedzy o świecie

Dzięki integracji z bazą wiedzy Gemini, model Omni potrafi wykraczać poza proste odtwarzanie wizualnych schematów. Na podstawie krótkiego zapytania tekstowego system potrafi wygenerować materiał o wysokim stopniu skomplikowania merytorycznego – na przykład wierną naukowo animację poklatkową tłumaczącą fałdowanie białek, stylizowaną na film z plasteliny.

Narzędzie potrafi również miksować ze sobą zupełnie skrajne formaty wejściowe (zasada „any-to-any”). Użytkownik może wgrać statyczny plik graficzny (jako referencję stylu), plik wideo (jako referencję ruchu) oraz plik audio (jako tło muzyczne), a Gemini Omni Flash połączy te elementy w jeden spójny, zsynchronizowany z rytmem muzyki klip.

Cyfrowe awatary, bezpieczeństwo i dostępność

W ramach odpowiedzialnego rozwoju technologii, Google wprowadza funkcję tworzenia filmów z własnym cyfrowym awatarem, który potrafi posługiwać się sklonowanym głosem użytkownika. Zaawansowane funkcje edycji mowy są obecnie intensywnie testowane pod kątem bezpieczeństwa.

Aby zapobiec nadużyciom i ułatwić identyfikację syntetycznych materiałów, każdy film wygenerowany przez Gemini Omni Flash zostaje automatycznie opatrzony niewidocznym dla ludzkiego oka cyfrowym znakiem wodnym SynthID oraz metadanymi identyfikacyjnymi standardu C2PA. Pozwala to na natychmiastowe zweryfikowanie pochodzenia filmu z poziomu wyszukiwarki Google czy przeglądarki Chrome.

Model Gemini Omni Flash debiutuje dzisiaj globalnie dla subskrybentów planów Google AI Pro oraz Ultra w aplikacji Gemini i platformie Google Flow. W najbliższych dniach funkcja zostanie udostępniona bezpłatnie użytkownikom w sekcjach YouTube Shorts oraz aplikacji YouTube Create, natomiast deweloperzy otrzymają dostęp do interfejsów API w nadchodzących tygodniach.

#AI #edycjaWideo #GeminiOmni #GeminiOmniFlash #generatorWideo #Google #GoogleIO2026 #iMagazine #SynthID #sztucznaInteligencja #technologia

#ai #edycjawideo #geminiomni #geminiomniflash #generatorwideo #google

Agnieszka Serafinowicz @[email protected] · 2026-05-20 · 05:00 UTC

Google I/O 2026: nadchodzi era agentów Gemini. Gigant stawia na autonomię, szybkość i potężną infrastrukturę

Podczas tegorocznej konferencji Google I/O, CEO firmy, Sundar Pichai, oficjalnie ogłosił wejście w erę agentów.

Google przestało mówić wyłącznie o modelach językowych, a zaczęło wdrażać zintegrowane, całodobowe systemy AI, które nie tylko odpowiadają na pytania, ale samodzielnie wykonują za nas złożone zadania. Skala zmian jest gigantyczna – firma przetwarza już ponad 3,2 biliarda tokenów miesięcznie, a w rozwój infrastruktury zainwestuje w tym roku blisko 190 miliardów dolarów.

Oto najważniejsze nowości sprzętowe i programowe zaprezentowane podczas wydarzenia.

Nowe procesory: TPU 8. generacji

Podstawą nowej ery AI jest potężna infrastruktura. Google zaprezentowało procesory tensorowe (TPU) 8. generacji, podzielone na dwa wyspecjalizowane układy:

TPU 8t: zoptymalizowany pod kątem wstępnego uczenia modeli na ogromną skalę. Zapewnia trzykrotnie większą moc obliczeniową niż poprzednia generacja.
TPU 8i: zaprojektowany z myślą o błyskawicznym wnioskowaniu (generowaniu odpowiedzi), co ma krytyczne znaczenie dla opóźnień w usługach takich jak wyszukiwarka.

Oba układy cechują się nawet dwukrotnie wyższą wydajnością energetyczną.

Ewolucja modeli: Gemini Omni oraz Gemini 3.5 Flash

Google znacząco poszerza możliwości swoich flagowych modeli AI:

Gemini Omni Flash: nowy, rewolucyjny model zdolny do generowania wyników na podstawie dowolnych danych wejściowych. Początkowo obsługuje pliki wideo (z czasem również obrazy i tekst), łącząc inteligencję Gemini z modelami multimedialnymi. Dostępny już teraz w aplikacji Gemini i YouTube Shorts.
Gemini 3.5 Flash: pierwszy z nowej serii modeli, który imponuje szybkością i opłacalnością. Jest zoptymalizowany pod kątem programowania i skomplikowanych przepływów pracy. W porównaniu do wersji 3.1 Pro, oferuje lepsze wyniki we wszystkich testach, a przy odpowiedniej optymalizacji działa aż 12-krotnie szybciej niż konkurencyjne rozwiązania, pozwalając firmom na gigantyczne oszczędności rzędu miliardów dolarów rocznie.

Platforma Antigravity 2.0 i autonomiczny Gemini Spark

Największym przełomem I/O 2026 jest jednak skupienie się na agentach:

Antigravity 2.0: środowisko programistyczne ewoluowało w zaawansowaną platformę na komputery, służącą do tworzenia i zarządzania całymi kohortami autonomicznych agentów AI.
Gemini Spark: twój nowy, osobisty agent AI. Działa 24 godziny na dobę w chmurze (bez konieczności włączania komputera), wykonując w tle długoterminowe zadania. Wkrótce zintegruje się z systemem Android (w nowej przestrzeni Android Halo) oraz przeglądarką Chrome.
Agenty w wyszukiwarce: już latem do wyszukiwarki trafią agenty informacyjne – spersonalizowane boty pracujące w tle, które będą na bieżąco monitorować sieć i dostarczać użytkownikom potrzebne informacje w idealnie dobranym momencie.

Codzienne aplikacje zyskują supermoce

Rozwój AI bezpośrednio wpłynie na to, jak korzystamy z najpopularniejszych usług Google:

Zapytaj YouTube: nowa funkcja (testowana latem w USA) ułatwi przeszukiwanie wideo. Pozwoli zadawać pytania i automatycznie przeniesie użytkownika do konkretnego, najbardziej relewantnego fragmentu filmu.
Dokumenty Live: koniec z pisaniem skomplikowanych promptów. Od lata subskrybenci będą mogli tworzyć i edytować dokumenty w locie, po prostu dyktując polecenia głosowe, które modele AI przetworzą w czasie rzeczywistym.
Google Pics: nowe narzędzie do generowania i edycji grafiki oparte na modelu Nano Banana. Wyróżnia się tym, że traktuje elementy obrazu jako osobne obiekty 3D, a nie płaskie piksele, pozwalając na niespotykaną dotąd swobodę w modyfikowaniu detali.

Przejrzystość treści i… nowe okulary

W walce z deepfake’ami Google rozszerza swoje narzędzie znakowania wodnego SynthID. Trafi ono bezpośrednio do przeglądarki Chrome i Wyszukiwarki. Co ważne, do inicjatywy oznaczania treści dołączyły kolejne wielkie firmy, w tym m.in. OpenAI i Eleven Labs.

Na koniec Google zapowiedziało nową generację inteligentnych okularów. Jeszcze tej jesieni zadebiutuje ich wersja audio, pozwalająca na komunikację z Gemini i bezdotykową obsługę prosto do ucha, a w późniejszym czasie pojawi się wariant wyposażony w wyświetlacz.

#agentyAI #AI #Gemini #Gemini35Flash #GeminiOmni #Google #GoogleIO2026 #iMagazine #nowości #sztucznaInteligencja #technologia #TPU

#agentyai #ai #gemini #gemini35flash #geminiomni #google

Agnieszka Serafinowicz @[email protected] · 2026-05-20 · 05:00 UTC

Google I/O 2026: nadchodzi era agentów Gemini. Gigant stawia na autonomię, szybkość i potężną infrastrukturę

Podczas tegorocznej konferencji Google I/O, CEO firmy, Sundar Pichai, oficjalnie ogłosił wejście w erę agentów.

Google przestało mówić wyłącznie o modelach językowych, a zaczęło wdrażać zintegrowane, całodobowe systemy AI, które nie tylko odpowiadają na pytania, ale samodzielnie wykonują za nas złożone zadania. Skala zmian jest gigantyczna – firma przetwarza już ponad 3,2 biliarda tokenów miesięcznie, a w rozwój infrastruktury zainwestuje w tym roku blisko 190 miliardów dolarów.

Oto najważniejsze nowości sprzętowe i programowe zaprezentowane podczas wydarzenia.

Nowe procesory: TPU 8. generacji

Podstawą nowej ery AI jest potężna infrastruktura. Google zaprezentowało procesory tensorowe (TPU) 8. generacji, podzielone na dwa wyspecjalizowane układy:

TPU 8t: zoptymalizowany pod kątem wstępnego uczenia modeli na ogromną skalę. Zapewnia trzykrotnie większą moc obliczeniową niż poprzednia generacja.
TPU 8i: zaprojektowany z myślą o błyskawicznym wnioskowaniu (generowaniu odpowiedzi), co ma krytyczne znaczenie dla opóźnień w usługach takich jak wyszukiwarka.

Oba układy cechują się nawet dwukrotnie wyższą wydajnością energetyczną.

Ewolucja modeli: Gemini Omni oraz Gemini 3.5 Flash

Google znacząco poszerza możliwości swoich flagowych modeli AI:

Gemini Omni Flash: nowy, rewolucyjny model zdolny do generowania wyników na podstawie dowolnych danych wejściowych. Początkowo obsługuje pliki wideo (z czasem również obrazy i tekst), łącząc inteligencję Gemini z modelami multimedialnymi. Dostępny już teraz w aplikacji Gemini i YouTube Shorts.
Gemini 3.5 Flash: pierwszy z nowej serii modeli, który imponuje szybkością i opłacalnością. Jest zoptymalizowany pod kątem programowania i skomplikowanych przepływów pracy. W porównaniu do wersji 3.1 Pro, oferuje lepsze wyniki we wszystkich testach, a przy odpowiedniej optymalizacji działa aż 12-krotnie szybciej niż konkurencyjne rozwiązania, pozwalając firmom na gigantyczne oszczędności rzędu miliardów dolarów rocznie.

Platforma Antigravity 2.0 i autonomiczny Gemini Spark

Największym przełomem I/O 2026 jest jednak skupienie się na agentach:

Antigravity 2.0: środowisko programistyczne ewoluowało w zaawansowaną platformę na komputery, służącą do tworzenia i zarządzania całymi kohortami autonomicznych agentów AI.
Gemini Spark: twój nowy, osobisty agent AI. Działa 24 godziny na dobę w chmurze (bez konieczności włączania komputera), wykonując w tle długoterminowe zadania. Wkrótce zintegruje się z systemem Android (w nowej przestrzeni Android Halo) oraz przeglądarką Chrome.
Agenty w wyszukiwarce: już latem do wyszukiwarki trafią agenty informacyjne – spersonalizowane boty pracujące w tle, które będą na bieżąco monitorować sieć i dostarczać użytkownikom potrzebne informacje w idealnie dobranym momencie.

Codzienne aplikacje zyskują supermoce

Rozwój AI bezpośrednio wpłynie na to, jak korzystamy z najpopularniejszych usług Google:

Zapytaj YouTube: nowa funkcja (testowana latem w USA) ułatwi przeszukiwanie wideo. Pozwoli zadawać pytania i automatycznie przeniesie użytkownika do konkretnego, najbardziej relewantnego fragmentu filmu.
Dokumenty Live: koniec z pisaniem skomplikowanych promptów. Od lata subskrybenci będą mogli tworzyć i edytować dokumenty w locie, po prostu dyktując polecenia głosowe, które modele AI przetworzą w czasie rzeczywistym.
Google Pics: nowe narzędzie do generowania i edycji grafiki oparte na modelu Nano Banana. Wyróżnia się tym, że traktuje elementy obrazu jako osobne obiekty 3D, a nie płaskie piksele, pozwalając na niespotykaną dotąd swobodę w modyfikowaniu detali.

Przejrzystość treści i… nowe okulary

W walce z deepfake’ami Google rozszerza swoje narzędzie znakowania wodnego SynthID. Trafi ono bezpośrednio do przeglądarki Chrome i Wyszukiwarki. Co ważne, do inicjatywy oznaczania treści dołączyły kolejne wielkie firmy, w tym m.in. OpenAI i Eleven Labs.

Na koniec Google zapowiedziało nową generację inteligentnych okularów. Jeszcze tej jesieni zadebiutuje ich wersja audio, pozwalająca na komunikację z Gemini i bezdotykową obsługę prosto do ucha, a w późniejszym czasie pojawi się wariant wyposażony w wyświetlacz.

#agentyAI #AI #Gemini #Gemini35Flash #GeminiOmni #Google #GoogleIO2026 #iMagazine #nowości #sztucznaInteligencja #technologia #TPU

#agentyai #ai #gemini #gemini35flash #geminiomni #google

Agnieszka Serafinowicz @[email protected] · 2026-05-20 · 05:00 UTC

Google I/O 2026: nadchodzi era agentów Gemini. Gigant stawia na autonomię, szybkość i potężną infrastrukturę

Podczas tegorocznej konferencji Google I/O, CEO firmy, Sundar Pichai, oficjalnie ogłosił wejście w erę agentów.

Google przestało mówić wyłącznie o modelach językowych, a zaczęło wdrażać zintegrowane, całodobowe systemy AI, które nie tylko odpowiadają na pytania, ale samodzielnie wykonują za nas złożone zadania. Skala zmian jest gigantyczna – firma przetwarza już ponad 3,2 biliarda tokenów miesięcznie, a w rozwój infrastruktury zainwestuje w tym roku blisko 190 miliardów dolarów.

Oto najważniejsze nowości sprzętowe i programowe zaprezentowane podczas wydarzenia.

Nowe procesory: TPU 8. generacji

Podstawą nowej ery AI jest potężna infrastruktura. Google zaprezentowało procesory tensorowe (TPU) 8. generacji, podzielone na dwa wyspecjalizowane układy:

TPU 8t: zoptymalizowany pod kątem wstępnego uczenia modeli na ogromną skalę. Zapewnia trzykrotnie większą moc obliczeniową niż poprzednia generacja.
TPU 8i: zaprojektowany z myślą o błyskawicznym wnioskowaniu (generowaniu odpowiedzi), co ma krytyczne znaczenie dla opóźnień w usługach takich jak wyszukiwarka.

Oba układy cechują się nawet dwukrotnie wyższą wydajnością energetyczną.

Ewolucja modeli: Gemini Omni oraz Gemini 3.5 Flash

Google znacząco poszerza możliwości swoich flagowych modeli AI:

Gemini Omni Flash: nowy, rewolucyjny model zdolny do generowania wyników na podstawie dowolnych danych wejściowych. Początkowo obsługuje pliki wideo (z czasem również obrazy i tekst), łącząc inteligencję Gemini z modelami multimedialnymi. Dostępny już teraz w aplikacji Gemini i YouTube Shorts.
Gemini 3.5 Flash: pierwszy z nowej serii modeli, który imponuje szybkością i opłacalnością. Jest zoptymalizowany pod kątem programowania i skomplikowanych przepływów pracy. W porównaniu do wersji 3.1 Pro, oferuje lepsze wyniki we wszystkich testach, a przy odpowiedniej optymalizacji działa aż 12-krotnie szybciej niż konkurencyjne rozwiązania, pozwalając firmom na gigantyczne oszczędności rzędu miliardów dolarów rocznie.

Platforma Antigravity 2.0 i autonomiczny Gemini Spark

Największym przełomem I/O 2026 jest jednak skupienie się na agentach:

Antigravity 2.0: środowisko programistyczne ewoluowało w zaawansowaną platformę na komputery, służącą do tworzenia i zarządzania całymi kohortami autonomicznych agentów AI.
Gemini Spark: twój nowy, osobisty agent AI. Działa 24 godziny na dobę w chmurze (bez konieczności włączania komputera), wykonując w tle długoterminowe zadania. Wkrótce zintegruje się z systemem Android (w nowej przestrzeni Android Halo) oraz przeglądarką Chrome.
Agenty w wyszukiwarce: już latem do wyszukiwarki trafią agenty informacyjne – spersonalizowane boty pracujące w tle, które będą na bieżąco monitorować sieć i dostarczać użytkownikom potrzebne informacje w idealnie dobranym momencie.

Codzienne aplikacje zyskują supermoce

Rozwój AI bezpośrednio wpłynie na to, jak korzystamy z najpopularniejszych usług Google:

Zapytaj YouTube: nowa funkcja (testowana latem w USA) ułatwi przeszukiwanie wideo. Pozwoli zadawać pytania i automatycznie przeniesie użytkownika do konkretnego, najbardziej relewantnego fragmentu filmu.
Dokumenty Live: koniec z pisaniem skomplikowanych promptów. Od lata subskrybenci będą mogli tworzyć i edytować dokumenty w locie, po prostu dyktując polecenia głosowe, które modele AI przetworzą w czasie rzeczywistym.
Google Pics: nowe narzędzie do generowania i edycji grafiki oparte na modelu Nano Banana. Wyróżnia się tym, że traktuje elementy obrazu jako osobne obiekty 3D, a nie płaskie piksele, pozwalając na niespotykaną dotąd swobodę w modyfikowaniu detali.

Przejrzystość treści i… nowe okulary

W walce z deepfake’ami Google rozszerza swoje narzędzie znakowania wodnego SynthID. Trafi ono bezpośrednio do przeglądarki Chrome i Wyszukiwarki. Co ważne, do inicjatywy oznaczania treści dołączyły kolejne wielkie firmy, w tym m.in. OpenAI i Eleven Labs.

Na koniec Google zapowiedziało nową generację inteligentnych okularów. Jeszcze tej jesieni zadebiutuje ich wersja audio, pozwalająca na komunikację z Gemini i bezdotykową obsługę prosto do ucha, a w późniejszym czasie pojawi się wariant wyposażony w wyświetlacz.

#agentyAI #AI #Gemini #Gemini35Flash #GeminiOmni #Google #GoogleIO2026 #iMagazine #nowości #sztucznaInteligencja #technologia #TPU

#agentyai #ai #gemini #gemini35flash #geminiomni #google

Agnieszka Serafinowicz @[email protected] · 2026-05-20 · 05:00 UTC

Google I/O 2026: nadchodzi era agentów Gemini. Gigant stawia na autonomię, szybkość i potężną infrastrukturę

Podczas tegorocznej konferencji Google I/O, CEO firmy, Sundar Pichai, oficjalnie ogłosił wejście w erę agentów.

Google przestało mówić wyłącznie o modelach językowych, a zaczęło wdrażać zintegrowane, całodobowe systemy AI, które nie tylko odpowiadają na pytania, ale samodzielnie wykonują za nas złożone zadania. Skala zmian jest gigantyczna – firma przetwarza już ponad 3,2 biliarda tokenów miesięcznie, a w rozwój infrastruktury zainwestuje w tym roku blisko 190 miliardów dolarów.

Oto najważniejsze nowości sprzętowe i programowe zaprezentowane podczas wydarzenia.

Nowe procesory: TPU 8. generacji

Podstawą nowej ery AI jest potężna infrastruktura. Google zaprezentowało procesory tensorowe (TPU) 8. generacji, podzielone na dwa wyspecjalizowane układy:

TPU 8t: zoptymalizowany pod kątem wstępnego uczenia modeli na ogromną skalę. Zapewnia trzykrotnie większą moc obliczeniową niż poprzednia generacja.
TPU 8i: zaprojektowany z myślą o błyskawicznym wnioskowaniu (generowaniu odpowiedzi), co ma krytyczne znaczenie dla opóźnień w usługach takich jak wyszukiwarka.

Oba układy cechują się nawet dwukrotnie wyższą wydajnością energetyczną.

Ewolucja modeli: Gemini Omni oraz Gemini 3.5 Flash

Google znacząco poszerza możliwości swoich flagowych modeli AI:

Gemini Omni Flash: nowy, rewolucyjny model zdolny do generowania wyników na podstawie dowolnych danych wejściowych. Początkowo obsługuje pliki wideo (z czasem również obrazy i tekst), łącząc inteligencję Gemini z modelami multimedialnymi. Dostępny już teraz w aplikacji Gemini i YouTube Shorts.
Gemini 3.5 Flash: pierwszy z nowej serii modeli, który imponuje szybkością i opłacalnością. Jest zoptymalizowany pod kątem programowania i skomplikowanych przepływów pracy. W porównaniu do wersji 3.1 Pro, oferuje lepsze wyniki we wszystkich testach, a przy odpowiedniej optymalizacji działa aż 12-krotnie szybciej niż konkurencyjne rozwiązania, pozwalając firmom na gigantyczne oszczędności rzędu miliardów dolarów rocznie.

Platforma Antigravity 2.0 i autonomiczny Gemini Spark

Największym przełomem I/O 2026 jest jednak skupienie się na agentach:

Antigravity 2.0: środowisko programistyczne ewoluowało w zaawansowaną platformę na komputery, służącą do tworzenia i zarządzania całymi kohortami autonomicznych agentów AI.
Gemini Spark: twój nowy, osobisty agent AI. Działa 24 godziny na dobę w chmurze (bez konieczności włączania komputera), wykonując w tle długoterminowe zadania. Wkrótce zintegruje się z systemem Android (w nowej przestrzeni Android Halo) oraz przeglądarką Chrome.
Agenty w wyszukiwarce: już latem do wyszukiwarki trafią agenty informacyjne – spersonalizowane boty pracujące w tle, które będą na bieżąco monitorować sieć i dostarczać użytkownikom potrzebne informacje w idealnie dobranym momencie.

Codzienne aplikacje zyskują supermoce

Rozwój AI bezpośrednio wpłynie na to, jak korzystamy z najpopularniejszych usług Google:

Zapytaj YouTube: nowa funkcja (testowana latem w USA) ułatwi przeszukiwanie wideo. Pozwoli zadawać pytania i automatycznie przeniesie użytkownika do konkretnego, najbardziej relewantnego fragmentu filmu.
Dokumenty Live: koniec z pisaniem skomplikowanych promptów. Od lata subskrybenci będą mogli tworzyć i edytować dokumenty w locie, po prostu dyktując polecenia głosowe, które modele AI przetworzą w czasie rzeczywistym.
Google Pics: nowe narzędzie do generowania i edycji grafiki oparte na modelu Nano Banana. Wyróżnia się tym, że traktuje elementy obrazu jako osobne obiekty 3D, a nie płaskie piksele, pozwalając na niespotykaną dotąd swobodę w modyfikowaniu detali.

Przejrzystość treści i… nowe okulary

W walce z deepfake’ami Google rozszerza swoje narzędzie znakowania wodnego SynthID. Trafi ono bezpośrednio do przeglądarki Chrome i Wyszukiwarki. Co ważne, do inicjatywy oznaczania treści dołączyły kolejne wielkie firmy, w tym m.in. OpenAI i Eleven Labs.

Na koniec Google zapowiedziało nową generację inteligentnych okularów. Jeszcze tej jesieni zadebiutuje ich wersja audio, pozwalająca na komunikację z Gemini i bezdotykową obsługę prosto do ucha, a w późniejszym czasie pojawi się wariant wyposażony w wyświetlacz.

#agentyAI #AI #Gemini #Gemini35Flash #GeminiOmni #Google #GoogleIO2026 #iMagazine #nowości #sztucznaInteligencja #technologia #TPU

#tpu #technologia #sztucznainteligencja #nowosci #imagazine #googleio2026

Agnieszka Serafinowicz @[email protected] · 2026-05-20 · 05:00 UTC

Google I/O 2026: nadchodzi era agentów Gemini. Gigant stawia na autonomię, szybkość i potężną infrastrukturę

Podczas tegorocznej konferencji Google I/O, CEO firmy, Sundar Pichai, oficjalnie ogłosił wejście w erę agentów.

Google przestało mówić wyłącznie o modelach językowych, a zaczęło wdrażać zintegrowane, całodobowe systemy AI, które nie tylko odpowiadają na pytania, ale samodzielnie wykonują za nas złożone zadania. Skala zmian jest gigantyczna – firma przetwarza już ponad 3,2 biliarda tokenów miesięcznie, a w rozwój infrastruktury zainwestuje w tym roku blisko 190 miliardów dolarów.

Oto najważniejsze nowości sprzętowe i programowe zaprezentowane podczas wydarzenia.

Nowe procesory: TPU 8. generacji

Podstawą nowej ery AI jest potężna infrastruktura. Google zaprezentowało procesory tensorowe (TPU) 8. generacji, podzielone na dwa wyspecjalizowane układy:

TPU 8t: zoptymalizowany pod kątem wstępnego uczenia modeli na ogromną skalę. Zapewnia trzykrotnie większą moc obliczeniową niż poprzednia generacja.
TPU 8i: zaprojektowany z myślą o błyskawicznym wnioskowaniu (generowaniu odpowiedzi), co ma krytyczne znaczenie dla opóźnień w usługach takich jak wyszukiwarka.

Oba układy cechują się nawet dwukrotnie wyższą wydajnością energetyczną.

Ewolucja modeli: Gemini Omni oraz Gemini 3.5 Flash

Google znacząco poszerza możliwości swoich flagowych modeli AI:

Gemini Omni Flash: nowy, rewolucyjny model zdolny do generowania wyników na podstawie dowolnych danych wejściowych. Początkowo obsługuje pliki wideo (z czasem również obrazy i tekst), łącząc inteligencję Gemini z modelami multimedialnymi. Dostępny już teraz w aplikacji Gemini i YouTube Shorts.
Gemini 3.5 Flash: pierwszy z nowej serii modeli, który imponuje szybkością i opłacalnością. Jest zoptymalizowany pod kątem programowania i skomplikowanych przepływów pracy. W porównaniu do wersji 3.1 Pro, oferuje lepsze wyniki we wszystkich testach, a przy odpowiedniej optymalizacji działa aż 12-krotnie szybciej niż konkurencyjne rozwiązania, pozwalając firmom na gigantyczne oszczędności rzędu miliardów dolarów rocznie.

Platforma Antigravity 2.0 i autonomiczny Gemini Spark

Największym przełomem I/O 2026 jest jednak skupienie się na agentach:

Antigravity 2.0: środowisko programistyczne ewoluowało w zaawansowaną platformę na komputery, służącą do tworzenia i zarządzania całymi kohortami autonomicznych agentów AI.
Gemini Spark: twój nowy, osobisty agent AI. Działa 24 godziny na dobę w chmurze (bez konieczności włączania komputera), wykonując w tle długoterminowe zadania. Wkrótce zintegruje się z systemem Android (w nowej przestrzeni Android Halo) oraz przeglądarką Chrome.
Agenty w wyszukiwarce: już latem do wyszukiwarki trafią agenty informacyjne – spersonalizowane boty pracujące w tle, które będą na bieżąco monitorować sieć i dostarczać użytkownikom potrzebne informacje w idealnie dobranym momencie.

Codzienne aplikacje zyskują supermoce

Rozwój AI bezpośrednio wpłynie na to, jak korzystamy z najpopularniejszych usług Google:

Zapytaj YouTube: nowa funkcja (testowana latem w USA) ułatwi przeszukiwanie wideo. Pozwoli zadawać pytania i automatycznie przeniesie użytkownika do konkretnego, najbardziej relewantnego fragmentu filmu.
Dokumenty Live: koniec z pisaniem skomplikowanych promptów. Od lata subskrybenci będą mogli tworzyć i edytować dokumenty w locie, po prostu dyktując polecenia głosowe, które modele AI przetworzą w czasie rzeczywistym.
Google Pics: nowe narzędzie do generowania i edycji grafiki oparte na modelu Nano Banana. Wyróżnia się tym, że traktuje elementy obrazu jako osobne obiekty 3D, a nie płaskie piksele, pozwalając na niespotykaną dotąd swobodę w modyfikowaniu detali.

Przejrzystość treści i… nowe okulary

W walce z deepfake’ami Google rozszerza swoje narzędzie znakowania wodnego SynthID. Trafi ono bezpośrednio do przeglądarki Chrome i Wyszukiwarki. Co ważne, do inicjatywy oznaczania treści dołączyły kolejne wielkie firmy, w tym m.in. OpenAI i Eleven Labs.

Na koniec Google zapowiedziało nową generację inteligentnych okularów. Jeszcze tej jesieni zadebiutuje ich wersja audio, pozwalająca na komunikację z Gemini i bezdotykową obsługę prosto do ucha, a w późniejszym czasie pojawi się wariant wyposażony w wyświetlacz.