#vertex-ai — Public Fediverse posts on home.social

michabbb @[email protected] · 2026-04-23 · 10:48 UTC

→ Mindlid: 20% lift in top-1 recall for wellness app

🔗 Available via #GeminiAPI & #VertexAI
Integrates with #LangChain, #LlamaIndex, #Haystack, #Weaviate, #Qdrant, #ChromaDB & Vector Search
🧪 Colab notebooks for Gemini API & Vertex AI ready to use

🌐
https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-embedding-2-generally-available/

#geminiapi #vertexai #langchain #llamaindex #haystack #weaviate

Judith van Stegeren @jd7h · 2026-04-16 · 10:34 UTC

We were looking for a local tokenizer for counting the number of input tokens before calling the gemini-embedding-001 endpoint on vertex AI. Turns out this Gemma tokenizer returns exactly the same number of tokens as the usage in the embeddings result `embedding.statistics.token_count` of the Gemini embeddings endpoint. Tested on 2000 datapoints. 😁

https://github.com/google/gemma_pytorch/blob/33b652c465537c6158f9a472ea5700e5e770ad3f/tokenizer/tokenizer.model

#gemini #embeddings #gemma #vertexai #genai

AllAboutSecurity @[email protected] · 2026-03-31 · 13:43 UTC

Doppelagenten in der Cloud: Sicherheitslücken in GCP Vertex AI aufgedeckt

Über eine fehlerhafte Standardkonfiguration der Berechtigungsbereiche und die Kompromittierung eines einzelnen Service-Agenten ließ sich das Berechtigungsmodell von Vertex AI systematisch ausnutzen.

https://www.all-about-security.de/doppelagenten-in-der-cloud-sicherheitsluecken-in-gcp-vertex-ai-aufgedeckt/

#cloud #google #vertexai #gcp #ki #ai #iam

#cloud #google #vertexai #gcp #ki #ai

TechGlimmer @[email protected] · 2026-03-03 · 23:43 UTC

If you’re shipping agents, chatbots or translation at scale, you’ll want to look at Gemini 3.1 Flash-Lite.
It adds adaptive “thinking levels” so you can keep simple tasks blazing fast while still dialing up deeper reasoning when you need it.

#GenAI #GeminiFlashLite #VertexAI #MachineLearning

#genai #geminiflashlite #vertexai #machinelearning

brozu ▪️ @[email protected] · 2026-02-03 · 21:36 UTC

Aggiornamento su Claude #Sonnet 5:

I log #VertexAI alimentano speculazioni su un rilascio imminente con rumors di :
- pricing competitivo (-50% vs #Opus 4.5)
- 1M token context
- migliore SWE-bench.

Tuttavia, si tratta di screenshot non verificati da fonti ufficiali e infatti, al momento, #Anthropic non ha annunciato nulla.

#sonnet #vertexai #opus #anthropic #claude #LLM #ai

#sonnet #vertexai #opus #anthropic #claude #llm

Mela News :verified: @[email protected] · 2026-02-03 · 16:52 UTC

Log di errore Google Vertex AI rivelano Claude Sonnet 5 in arrivo il 3 febbraio 2026.

Nome in codice: Fennec.

Nuova modalità "Dev Team" o Swarm per elaborazione non lineare. 🔍🤖

#ai #claude #vertexai

michabbb @[email protected] · 2026-01-23 · 19:08 UTC

🩻 I Tried to Use #AI to Read My Friend’s Mom’s #MRI 🩻

spoiler: don't trust Ai 😏

#medgemma #health #google #vertexai

https://macropage.medium.com/i-tried-to-use-ai-to-read-my-friends-mom-s-mri-ed642700e95d?source=friends_link&sk=6b081ac6739d3813e334cb697460b72d

#ai #mri #medgemma #health #google #vertexai

DevTo VN Bot @[email protected] · 2026-01-20 · 15:13 UTC

Google Vertex AI Search cho phép tích hợp RAG vào tìm kiếm nội bộ site: tự động truy xuất, tăng cường và sinh câu trả lời từ nội dung trang. Không cần duy trì vector DB, chi phí thấp (≈ $4‑10 cho 1k truy vấn). Đã triển khai widget trên WordPress, hỗ trợ hỏi‑đáp ngôn ngữ tự nhiên. #AI #VertexAI #RAG #Google #Search #CôngNghệ #Technology

https://dev.to/letswrite/zhan-nei-sou-xun-jia-shang-aishi-yong-google-vertex-ai-search-rag-da-zao-zhi-hui-wen-da-xing-sou-xun-302c

#ai #vertexai #rag #google #search #congnghệ

Agnieszka Serafinowicz @[email protected] · 2026-01-07 · 17:00 UTC

Orange uzbraja konsultantów w Gemini. „AI Concierge” ma sprawić, że infolinia przestanie być koszmarem

Każdy z nas zna ten ból: przebijasz się przez automatyczne menu, tłumaczysz problem botowi, a gdy w końcu odbiera człowiek… musisz powtarzać wszystko od nowa. Orange Polska, we współpracy z Google Cloud, wdraża system „AI Concierge”, który ma wyeliminować ten i wiele innych problemów obsługi klienta.

Koniec z „o co chodziło?”

Nowe narzędzie, oparte na modelach Gemini i platformie Vertex AI, nie jest kolejnym czatbotem dla klientów. To „inteligentny asystent” dla pracownika infolinii.

Jego kluczową funkcją – i chyba najbardziej wyczekiwaną przez klientów – jest automatyczne podsumowanie rozmowy z botem. Zanim konsultant podniesie słuchawkę (lub dołączy do czatu), AI streści mu problem, z którym zgłasza się klient. Dzięki temu rozmowa ma zaczynać się od konkretów, a nie od frustrującego „w czym mogę pomóc?”, gdy przed chwilą opowiedzieliśmy całą historię automatowi.

Ściąga w czasie rzeczywistym

AI Concierge działa jak błyskawiczna wyszukiwarka wewnątrz firmowej bazy wiedzy. Zamiast przekopywać się przez regulaminy, cenniki czy instrukcje techniczne, konsultant otrzymuje gotowe podpowiedzi na ekranie.

Ma to kluczowe znaczenie w dwóch przypadkach:

Nowi pracownicy: system prowadzi ich za rękę, sugerując odpowiedzi i procedury, co skraca czas wdrożenia.
Problemy techniczne: AI potrafi przeanalizować diagnostykę niedziałającej usługi i od razu podsunąć rozwiązanie techniczne, które wcześniej wymagałoby konsultacji ze starszym inżynierem.

Uszyte na miarę, a nie z pudełka

Rozwiązanie zostało zbudowane od podstaw dla Orange, uwzględniając specyfikę polskiego rynku i oferty operatora (zarówno B2C, jak i B2B). Google dostarczyło technologię (chmura, modele językowe), ale logika działania została dopasowana do realnych potrzeb infolinii.

Jeśli system zadziała tak sprawnie, jak zapowiadają Magdalena Dziewguć z Google Cloud i dyrektorzy Orange, możemy spodziewać się krótszego czasu wiszenia na słuchawce i – miejmy nadzieję – mniej pomyłek przy rozwiązywaniu naszych problemów.

#AIConcierge #Gemini #GoogleCloud #infolinia #obsługaKlienta #Orange #tech #VertexAI

#aiconcierge #gemini #googlecloud #infolinia #obslugaklienta #orange

NERDS.xyz – Real Tech News for Real Nerds [Unofficial] @[email protected] · 2025-12-14 · 04:07 UTC

Google is killing customer service jobs with AI

https://web.brid.gy/r/https://nerds.xyz/2025/12/google-killing-customer-service-jobs/

#artificialintelligence #google #aiautomation #callcenters #customerservicejobs #enterpriseai

TechNadu @[email protected] · 2025-12-09 · 16:04 UTC

New AI-native threat: GeminiJack allowed zero-click exfiltration of Gmail, Docs & Calendar data in Google Gemini Enterprise + Vertex AI Search via indirect prompt injection in the RAG pipeline.

Analysis:
https://www.technadu.com/new-ai-native-threat-vulnerability-in-google-gemini-enterprise-and-vertex-ai-search-allowed-stealing-gmail-docs-and-calendar-data/615399/

#GeminiJack #AINativeThreats #GoogleGemini #VertexAI #PromptInjection #RAGSecurity #CyberSecurity

#geminijack #ainativethreats #googlegemini #vertexai #promptinjection #ragsecurity

PyVenice @[email protected] · 2025-11-30 · 16:07 UTC

Un’esperienza interessante!
Il nostro viaggio continua e questa volta siamo stati ospitati dai ragazzi del #GDGTreviso

Grazie a tutti per aver reso possibile questa serata!

In particolare a Gaspare che ha condiviso la sua esperienza su #Google #VertexAI e #Amazon #SageMaker ma anche ad Helder che ha fatto gli onori di casa e coordinato tutto con naturalezza, rivelandosi la vera colla della serata!

Noi ci aggiorniamo a gennaio 2026, buone feste!

#PyVenice #2 @pythonitalia #Python #GoogleCloud

#gdgtreviso #google #vertexai #amazon #sagemaker #pyvenice

Agnieszka Serafinowicz @[email protected] · 2025-11-17 · 08:00 UTC

CEO Google’a bawi się z rynkiem. Wyciek z serwerów potwierdza – premiera Gemini 3.0 jest tuż za rogiem

W świecie AI trwa obecnie gorączkowe obstawianie, kiedy Google wciśnie „czerwony guzik” i wypuści Gemini 3.0.

Na giełdzie prognostycznej Polymarket na datę premiery postawiono już ponad 800 000 dolarów. A co na to CEO Google? Sundar Pichai osobiście dolał oliwy do ognia, co tylko potwierdza: start nowej generacji Gemini jest bliski.

Cała branża wstrzymała oddech po tym, jak jeden z analityków opublikował na X (Twitterze) informację o zakładach, wskazując, że rynek obstawia premierę do 22 listopada. Sundar Pichai odpowiedział na ten wpis w typowy dla siebie sposób – wysyłając tylko jedną, tajemnicze dwie emotikony: „🤔”.

🤔🤔 https://t.co/qOnZ87TUh0
— Sundar Pichai (@sundarpichai) November 14, 2025

W korporacyjnym języku to klasyczne „puszczenie oczka”, które branża odczytała jednoznacznie: szykujcie się.

Twarde dowody: model widmo w logach Google

Spekulacje nie wzięły się znikąd. Kilka dni temu deweloperzy przeczesujący oficjalne logi platformy chmurowej Google Vertex AI (narzędzia dla programistów AI) natrafili na „model widmo”.

Wśród dostępnych zasobów pojawił się, a następnie zniknął, identyfikator: gemini-3-pro-preview-11-2025

To twardy dowód na to, że Gemini 3.0 Pro nie tylko istnieje, ale był już aktywnie testowany w listopadzie 2025. To właśnie ten wyciek uruchomił lawinę zakładów na Polymarket.

Co (prawdopodobnie) potrafi Gemini 3.0?

Z przecieków i analiz wyłania się obraz modelu, który ma być prawdziwą odpowiedzią na GPT-5.1:

Nowy silnik obrazów „Nano Banana 2”: plotki wskazują, że Gemini 3.0 zadebiutuje ze zintegrowanym, nowym modelem do generowania obrazów o nazwie kodowej „Nano Banana 2”. Ma on być znacznie potężniejszy niż dotychczasowe rozwiązania Google.
„Cicha premiera” już trwa: coraz głośniej mówi się, że Google już robi tzw. „shadow release” lub testy A/B. Oznacza to, że część z nas, korzystając z aplikacji mobilnej Gemini, już teraz może (nieświadomie) otrzymywać odpowiedzi z modelu 3.0. To by wyjaśniało nagły wzrost doniesień o „znacznie lepszych” i bardziej kreatywnych odpowiedziach.
Klonowanie systemów (plotka): najbardziej szalona plotka (powtarzana m.in. przez serwis BGR) dotyczy rzekomego dema, na którym Gemini 3.0 jest w stanie sklonować działający system operacyjny (np. iOS) na podstawie samego polecenia głosowego. Choć brzmi to jak science-fiction, pokazuje poziom oczekiwań wobec nowego modelu.

Wszystko wskazuje na to, że po serii dobrych, ale nieprzełomowych aktualizacji (jak Gemini 2.5), Google w końcu szykuje prawdziwy nokaut i chce odzyskać koronę króla AI.

OpenAI cicho wypuszcza GPT-5.1. Koniec z „robotycznym” tonem – teraz Ty wybierasz osobowość AI

#aiSi #gemini30 #google #nanoBanana2 #news #premieraGemini3 #przeciekGoogle #sundarPichai #vertexAi

#aisi #gemini30 #google #nanobanana2 #news #premieragemini3

Winbuzzer @[email protected] · 2025-11-07 · 14:18 UTC

https://winbuzzer.com/2025/11/07/leak-confirms-google-gemini-3-pro-and-nano-banana-2-could-launch-soon-xcxwbn

Leaks Confirm Google Gemini 3 Pro and Nano Banana 2 Could Launch Soon

#AI #GoogleAI #GoogleGemini #TechLeak #GenAI #NanoBanana2 #VertexAI #BigTech #Google #Alphabet

#ai #googleai #googlegemini #techleak #genai #nanobanana2

NERDS.xyz – Real Tech News for Real Nerds [Unofficial] @[email protected] · 2025-10-24 · 21:28 UTC

AI steps into the batter’s box at the World Series

https://web.brid.gy/r/https://nerds.xyz/2025/10/ai-steps-into-the-batters-box-at-the-world-series/

#artificialintelligence #aiworldseries #alexrodriguez #baseballtechnology #foxforesight #foxsports

bluestarultor @[email protected] · 2025-10-24 · 00:31 UTC

Hahaha! Oh, wow. Yep, fucking leeches.

I added the following to my robots.txt:

User-agent: Google-CloudVertexBot Disallow: /

It took my site from spiking somewhere 25-100 most days depending on what was in the news to a flat 0 ever since putting it in. You can still find me as the top result by Googling "Rogue Galaxy objective review," so it's not that you can't find me. It just absolutely destroyed AI searches. It should be noted that that's not a user agent string you'll see logged; it's buried in other Google bots because they're bastards, but it honors the directive.

Vertex was supposed to be opt-in, though.

EDIT: FML, I have no idea HOW, but it broke counting entirely and banned literally all bots. I had to take it out. OTZ

#Google #AI #NoAI #VertexAI #Vertex

#google #ai #noai #vertexai #vertex

IT News @[email protected] · 2025-10-15 · 20:05 UTC

Anthropic’s Claude Haiku 4.5 matches May’s frontier model at fraction of cost - On Wednesday, Anthropic released Claude Haiku 4.5, a small A... - https://arstechnica.com/ai/2025/10/anthropics-claude-haiku-4-5-matches-mays-frontier-model-at-fraction-of-cost/ #largelanguagemodels #aidevelopmenttools #machinelearning #aiprogramming #amazonbedrock #aibenchmarks #claudesonnet #aialignment #claudehaiku #googlecloud #codeagents #anthropic #aicoding #aimodels #aisafety #vertexai #biz⁢ #api

#largelanguagemodels #aidevelopmenttools #machinelearning #aiprogramming #amazonbedrock #aibenchmarks

NERDS.xyz – Real Tech News for Real Nerds [Unofficial] @[email protected] · 2025-10-07 · 22:12 UTC

Google introduces Gemini 2.5 Computer Use model to automate web and mobile interfaces

https://web.brid.gy/r/https://nerds.xyz/2025/10/gemini-25-computer-use-model/

#artificialintelligence #google #aiagents #deepmind #gemini25 #gemini25computeruse

Agnieszka Serafinowicz @[email protected] · 2025-09-26 · 16:00 UTC

Google aktualizuje Gemini. Lepsze formatowanie, rozumienie obrazów i nowe wersje dla deweloperów

Google poinformowało o wprowadzeniu aktualizacji dla swojego modelu sztucznej inteligencji, Gemini. Zmiany obejmują dwie oddzielne ścieżki. Poniżej szczegóły.

Pierwsza ze ścieżek dotyczy ulepszeń dostępnych już teraz dla użytkowników aplikacji Gemini, korzystających z modelu 2.5 Flash , a druga to udostępnienie nowych, testowych wersji modeli dla deweloperów.

Co nowego w aplikacji Gemini?

Użytkownicy, którzy w aplikacji Gemini wybiorą model 2.5 Flash, mogą już zauważyć trzy kluczowe ulepszenia. Po pierwsze, odpowiedzi generowane przez AI mają teraz lepszą organizację i formatowanie, z wykorzystaniem nagłówków, list i tabel, co ułatwia ich zrozumienie.

Po drugie, Gemini ma lepiej radzić sobie z wyjaśnianiem złożonych zagadnień, na przykład podczas pomocy w zadaniach domowych, dzięki ulepszonym zdolnościom rozumowania i prezentowaniu odpowiedzi krok po kroku.

Po trzecie, poprawiono zdolność rozumienia obrazów – można teraz przesyłać bardziej szczegółowe zdjęcia lub diagramy, a Gemini je wyjaśni, uporządkuje lub streści. Jako przykład podano możliwość stworzenia fiszek na podstawie zdjęcia notatek.

Nowości dla deweloperów: Flash i Flash-Lite

Równolegle Google udostępniło deweloperom nowe, poglądowe wersje modeli Gemini 2.5 Flash i 2.5 Flash-Lite, które są dostępne w platformach AI Studio i Vertex AI. Firma zaznacza, że nie są to nowe wersje stabilne, a ich celem jest zebranie opinii, które pomogą w kształtowaniu przyszłych, oficjalnych wydań.

Nowa wersja testowa modelu

Wersja gemini-2.5-flash-preview-09-2025 charakteryzuje się lepszym wykorzystaniem narzędzi, co przekłada się na wyższą wydajność w złożonych, wieloetapowych zadaniach. Model ten ma być również znacznie bardziej efektywny kosztowo, osiągając lepsze rezultaty przy mniejszym zużyciu tokenów. Z kolei lżejszy model,

Z kolei odmiana gemini-2.5-flash-lite-preview-09-2025, ma znacznie lepiej radzić sobie z wykonywaniem skomplikowanych poleceń, generować bardziej zwięzłe odpowiedzi oraz oferować wyższą jakość tłumaczeń i lepsze rozumienie dźwięku oraz obrazu.

Google rozszerza dostępność tańszego abonamentu AI Plus o 40 nowych krajów. Niestety, wciąż nie dla Polski

#AI #AIStudio #aktualizacja #Gemini25Flash #GoogleGemini #modelJęzykowy #news #sztucznaInteligencja #VertexAI

#ai #aistudio #aktualizacja #gemini25flash #googlegemini #modeljezykowy

Hackread.com @[email protected] · 2025-09-04 · 20:30 UTC

🚨 New "Model Namespace Reuse" lets attackers hijack trusted AI models on platforms like #VertexAI and #AzureAI by registering deleted names and inserting malicious versions via #HuggingFace.

Read: https://hackread.com/model-namespace-reuse-flaw-ai-models-google-microsoft/

#CyberSecurity #AI #Vulnerability #Microsoft #Google

#vertexai #azureai #huggingface #cybersecurity #ai #vulnerability