#gemini-deep-think — Public Fediverse posts
Live and recent posts from across the Fediverse tagged #gemini-deep-think, aggregated by home.social.
-
Google odpala Gemini 3.1 Pro. Sztuczna inteligencja z potężnym skokiem logiki
Google nie zwalnia tempa w wyścigu zbrojeń na rynku sztucznej inteligencji. Gigant z Mountain View właśnie ogłosił premierę modelu Gemini 3.1 Pro.
Google nie zwalnia tempa w wyścigu zbrojeń na rynku sztucznej inteligencji. Gigant z Mountain View właśnie ogłosił premierę modelu Gemini 3.1 Pro. Zamiast czekać na tradycyjną, dużą aktualizację „półgeneracyjną” (jak znane z przeszłości wersje 1.5 czy 2.5), firma zdecydowała się na szybki, punktowy przeskok o „0.1”. Powód? Skupiono się na jednym, ale za to kluczowym aspekcie: wdrożeniu nowego silnika, który zwiększa zdolności analityczne i radzenie sobie ze złożonymi problemami.
Innymi słowy, o ile poprzednie wersje skupiały się na szybkości (jak Gemini 3 Flash) czy ogólnej wszechstronności, tak Gemini 3.1 Pro zostało zaprojektowane z myślą o zadaniach, w których „prosta odpowiedź to za mało”.
Rdzeń z Deep Think i podwojona moc rozumowania
Najważniejszą nowością w wersji 3.1 Pro jest zaimplementowanie ulepszonej „inteligencji bazowej”, która zadebiutowała niedawno w wyspecjalizowanym modelu Gemini 3 Deep Think.
W praktyce przekłada się to na drastyczny wzrost zdolności analitycznych. Google pochwaliło się, że nowy model osiągnął wynik 77,1% w rygorystycznym teście ARC-AGI-2. Oznacza to, że Gemini 3.1 Pro oferuje ponad dwukrotnie wyższą wydajność w logicznym rozumowaniu niż jego bezpośredni poprzednik (wersja 3 Pro). To idealne narzędzie do przejrzystego tłumaczenia bardzo skomplikowanych zagadnień wizualnych, syntetyzowania ogromnych zbiorów danych w jeden czytelny widok czy wspierania rozbudowanych projektów kreatywnych.
Gdzie można z niego skorzystać?
Google stawia na szeroką dystrybucję od pierwszego dnia. Model Gemini 3.1 Pro debiutuje dziś w:
- Oficjalnej aplikacji Gemini (dla użytkowników).
- Usłudze NotebookLM (dla subskrybentów planów Google AI Pro oraz Ultra).
- Narzędziach dla deweloperów: poprzez Gemini API, Google AI Studio, Vertex AI, środowisko Antigravity, Gemini Enterprise, Gemini CLI oraz Android Studio.
Obecnie model znajduje się w fazie „preview” (wersji zapoznawczej). Google wykorzystuje ten etap do ostatecznej walidacji wydajności – szczególnie w kontekście ambitnych, wieloetapowych działań autonomicznych (tzw. agentic workflows) – zanim udostępni tę technologię jako domyślny standard dla wszystkich.
#aktualizacjaGemini2026 #ARCAGI2Gemini #Gemini31Pro #GeminiAIStudio #GeminiDeepThink #GoogleGeminiNowości #LLMRozumowanie #sztucznaInteligencjaGoogleGemini staje się kompozytorem. Google udostępnia model muzyczny Lyria 3 dla wszystkich
-
https://winbuzzer.com/2026/02/13/google-gemini-3-deep-think-solves-18-research-problems-xcxwbn/
Google Gemini 3 Deep Think Beats Opus 4.6 and GPT-5.2, Solves 18 New Research Problems
#AI #GoogleGemini #GeminiDeepThink #Google #BigTech #GoogleDeepMind #GoogleAI #Gemini3 #GoogleAIUltra #AIBenchmarks
-
CodeMender od Google DeepMind: AI, która sama znajduje i naprawia błędy bezpieczeństwa
Google DeepMind zaprezentowało wyniki badań nad CodeMender – nowym agentem AI zaprojektowanym do automatycznego poprawiania bezpieczeństwa kodu.
Rozwiązanie to ma odpowiadać na rosnący problem: choć tradycyjne metody i nowe narzędzia AI, takie jak Big Sleep czy OSS-Fuzz, są coraz skuteczniejsze w odkrywaniu luk, ich ręczne naprawianie jest czasochłonne. W miarę postępów w wykrywaniu podatności, programiści (ludzie) mogą przestać nadążać z ich usuwaniem.
Agent działa na dwa sposoby: reaktywnie, natychmiast łatając nowe luki, oraz proaktywnie, przepisując istniejący kod w celu wyeliminowania całych klas podatności. CodeMender wykorzystuje zdolności rozumowania modeli Gemini Deep Think, aby działać jako autonomiczny agent. Kluczowym elementem jest proces automatycznej walidacji, który gwarantuje, że proponowane poprawki są właściwe, nie powodują regresji (czyli nie psują innych funkcji w kodzie programu) i są zgodne z wytycznymi projektu, zanim zostaną przedstawione człowiekowi do weryfikacji.
Aby skutecznie znaleźć źródło problemu, CodeMender wykorzystuje zaawansowane techniki analizy programu, w tym analizę statyczną, dynamiczną i tzw. fuzzing (testowanie odporności kodu losowymi, celowo zniekształconymi danymi). Pozwala mu to zidentyfikować rzeczywistą przyczynę błędu, a nie tylko jego objawy – jak informuje Google DeepMind w swoim wpisie na oficjalnym blogu, w jednym z przykładów agent odkrył, że zgłaszany błąd przepełnienia bufora był w rzeczywistości spowodowany nieprawidłowym zarządzaniem stosu podczas parsowania XML. System korzysta również z wyspecjalizowanych agentów (systemy wieloagentowe), np. narzędzia opartego na LLM, które weryfikuje zmiany i pomaga w autokorekcie.
Google DeepMind poinformowało, że w ciągu ostatnich sześciu miesięcy, odkąd rozwijany jest CodeMender, zespół przesłał już 72 poprawki bezpieczeństwa do różnych projektów open source, z których wiele zostało już zaakceptowanych. Niektóre z tych projektów liczą nawet 4,5 miliona linii kodu. W ramach działań proaktywnych, CodeMender został użyty m.in. do biblioteki libwebp, aby dodać adnotacje -fbounds-safety. Mechanizm ten pomógłby zapobiec wykorzystaniu słynnej luki (CVE-2023-4863), która w przeszłości była używana do ataków na urządzenia z systemem iOS.
Badacze podkreślają, że choć wczesne wyniki są obiecujące, podchodzą do projektu ostrożnie, stawiając na niezawodność. Obecnie wszystkie poprawki generowane przez CodeMender są sprawdzane przez ekspertów DeepMind przed ich wysłaniem. Zespół planuje stopniowo zwiększać ten proces i kontaktować się z opiekunami krytycznych projektów open source, aby rozwijać własne dzieło na podstawie ich opinii. Celem jest udostępnienie CodeMender jako narzędzia, z którego będą mogli korzystać wszyscy programiści.
#AI #Bezpieczeństwo #CodeMender #cyberbezpieczeństwo #Gemini #GeminiDeepThink #Google #GoogleDeepMind #kod #lukiWOprogramowaniu #news #openSource #programowanie #sztucznaInteligencja