#bezpieczenstwoai — Public Fediverse posts on home.social

Agnieszka Serafinowicz @[email protected] · 2026-05-16 · 10:00 UTC

Śmiertelna lekcja zaufania. Pozew przeciwko OpenAI obnaża mroczną stronę sztucznej inteligencji

Przez ostatnie lata Dolina Krzemowa usilnie uczyła nas, że sztuczna inteligencja to wszechwiedząca wyrocznia, do której możemy zwrócić się z każdym problemem.

Nastolatkowie, tacy jak dziewiętnastoletni Sam Nelson, dorastali w przekonaniu, że skoro czatbot ma dostęp do całej wiedzy internetu, to jego odpowiedzi po prostu muszą być prawdziwe i bezpieczne. Ta bezgraniczna ufność znalazła właśnie swój tragiczny finał na sali sądowej. Rodzina zmarłego chłopaka pozywa OpenAI, oskarżając twórców ChatGPT o zaprojektowanie algorytmu, który zamiast chronić użytkownika, wcielił się w rolę osobistego, narkotykowego doradcy, co ostatecznie doprowadziło do tragedii.

Algorytm zaprogramowany, by potakiwać

Zapisy rozmów dołączone do pozwu rysują przerażający obraz tego, jak naprawdę działają wielkie modele językowe. Kiedy Sam zaczął wypytywać o eksperymenty z substancjami psychoaktywnymi, czatbot nie odciął go od informacji. Wręcz przeciwnie – algorytm, zaprojektowany po to, by za wszelką cenę zadowolić rozmówcę i utrzymać jego zaangażowanie, zaczął podpowiadać, jak „zoptymalizować fazę”. Zamiast pełnić funkcję obiektywnego źródła wiedzy, ChatGPT dostosował się do oczekiwań nastolatka. Kiedy chłopak szukał mocniejszych wrażeń, system wręcz wychodził przed szereg, sam z siebie sugerując wyższe dawki i niebezpieczne kombinacje, w tym śmiertelną mieszankę Kratomu i Xanaxu.

Autorytet bez licencji i moralności

Największe zagrożenie, na które zwracają uwagę prawnicy rodziny, płynie z formy, w jakiej sztuczna inteligencja serwuje swoje rady. ChatGPT udzielał wskazówek używając wysoce profesjonalnego języka – operował miligramami, medycznym żargonem i precyzyjnymi opisami reakcji chemicznych. Dla młodego, zagubionego człowieka brzmiało to jak konsultacja z doświadczonym lekarzem. Prawda jest jednak taka, że pod tym płaszczykiem autorytetu krył się po prostu generator tekstu pozbawiony medycznego wykształcenia, empatii i jakiegokolwiek moralnego kompasu. Co najbardziej wstrząsające, z logów wynika, że model w jednej z konwersacji trafnie zauważył, iż łączenie wspomnianych substancji z alkoholem grozi zatrzymaniem akcji oddechowej, po czym… i tak zasugerował to rozwiązanie jako „najlepszy ruch”, by złagodzić skutki uboczne.

Koniec prawnych wymówek dla Big Techu

Sprawa Nelsona może wywołać prawdziwe trzęsienie ziemi w branży technologicznej, a to za sprawą nowych przepisów, które weszły w życie w Kalifornii na początku tego roku. Prawo wyraźnie zabrania już firmom technologicznym zrzucania winy na „autonomiczną naturę” sztucznej inteligencji.

OpenAI nie może po prostu wzruszyć ramionami i stwierdzić, że to algorytm podjął błędną decyzję w ramach tzw. czarnej skrzynki. Jeśli prawnicy udowodnią, że firma wypuściła niedostatecznie przetestowany model, w którym filtry bezpieczeństwa ustąpiły miejsca walce o statystyki zaangażowania, twórcy ChatGPT mogą stanąć w obliczu gigantycznych odszkodowań i bezprecedensowych kar.

Pęknięta iluzja bezpieczeństwa

Historia Sama Nelsona to przypomnienie o tym, czym w istocie są dzisiejsze asystenty AI. To niezwykle zaawansowane maszyny do przewidywania kolejnych słów, które zrobią wszystko, by kontynuować konwersację.

Przedstawiciele OpenAI bronią się, twierdząc, że ich obecne modele są bezpieczniejsze, a czatbot nie zastąpi opieki medycznej. To prawda, ale problem leży głębiej – w samej konstrukcji tych narzędzi. Firmy technologiczne świadomie projektują boty tak, by brzmiały jak nasi najlepsi przyjaciele i wszechwiedzący mentorzy. Nie możemy się potem dziwić, że najbardziej podatni użytkownicy traktują ich śmiertelnie niebezpieczne sugestie jak prawdę objawioną.

Na każdego z nas przypada 110 botów. Jesteśmy cyfrową mniejszością we własnych systemach

#bezpieczeństwoAI #BigTech #ChatGPT #iMagazine #OpenAI #pozew #SamAltman #sztucznaInteligencja #technologia

#bezpieczenstwoai #bigtech #chatgpt #imagazine #openai #pozew

Agnieszka Serafinowicz @[email protected] · 2026-05-16 · 10:00 UTC

Śmiertelna lekcja zaufania. Pozew przeciwko OpenAI obnaża mroczną stronę sztucznej inteligencji

Przez ostatnie lata Dolina Krzemowa usilnie uczyła nas, że sztuczna inteligencja to wszechwiedząca wyrocznia, do której możemy zwrócić się z każdym problemem.

Nastolatkowie, tacy jak dziewiętnastoletni Sam Nelson, dorastali w przekonaniu, że skoro czatbot ma dostęp do całej wiedzy internetu, to jego odpowiedzi po prostu muszą być prawdziwe i bezpieczne. Ta bezgraniczna ufność znalazła właśnie swój tragiczny finał na sali sądowej. Rodzina zmarłego chłopaka pozywa OpenAI, oskarżając twórców ChatGPT o zaprojektowanie algorytmu, który zamiast chronić użytkownika, wcielił się w rolę osobistego, narkotykowego doradcy, co ostatecznie doprowadziło do tragedii.

Algorytm zaprogramowany, by potakiwać

Zapisy rozmów dołączone do pozwu rysują przerażający obraz tego, jak naprawdę działają wielkie modele językowe. Kiedy Sam zaczął wypytywać o eksperymenty z substancjami psychoaktywnymi, czatbot nie odciął go od informacji. Wręcz przeciwnie – algorytm, zaprojektowany po to, by za wszelką cenę zadowolić rozmówcę i utrzymać jego zaangażowanie, zaczął podpowiadać, jak „zoptymalizować fazę”. Zamiast pełnić funkcję obiektywnego źródła wiedzy, ChatGPT dostosował się do oczekiwań nastolatka. Kiedy chłopak szukał mocniejszych wrażeń, system wręcz wychodził przed szereg, sam z siebie sugerując wyższe dawki i niebezpieczne kombinacje, w tym śmiertelną mieszankę Kratomu i Xanaxu.

Autorytet bez licencji i moralności

Największe zagrożenie, na które zwracają uwagę prawnicy rodziny, płynie z formy, w jakiej sztuczna inteligencja serwuje swoje rady. ChatGPT udzielał wskazówek używając wysoce profesjonalnego języka – operował miligramami, medycznym żargonem i precyzyjnymi opisami reakcji chemicznych. Dla młodego, zagubionego człowieka brzmiało to jak konsultacja z doświadczonym lekarzem. Prawda jest jednak taka, że pod tym płaszczykiem autorytetu krył się po prostu generator tekstu pozbawiony medycznego wykształcenia, empatii i jakiegokolwiek moralnego kompasu. Co najbardziej wstrząsające, z logów wynika, że model w jednej z konwersacji trafnie zauważył, iż łączenie wspomnianych substancji z alkoholem grozi zatrzymaniem akcji oddechowej, po czym… i tak zasugerował to rozwiązanie jako „najlepszy ruch”, by złagodzić skutki uboczne.

Koniec prawnych wymówek dla Big Techu

Sprawa Nelsona może wywołać prawdziwe trzęsienie ziemi w branży technologicznej, a to za sprawą nowych przepisów, które weszły w życie w Kalifornii na początku tego roku. Prawo wyraźnie zabrania już firmom technologicznym zrzucania winy na „autonomiczną naturę” sztucznej inteligencji.

OpenAI nie może po prostu wzruszyć ramionami i stwierdzić, że to algorytm podjął błędną decyzję w ramach tzw. czarnej skrzynki. Jeśli prawnicy udowodnią, że firma wypuściła niedostatecznie przetestowany model, w którym filtry bezpieczeństwa ustąpiły miejsca walce o statystyki zaangażowania, twórcy ChatGPT mogą stanąć w obliczu gigantycznych odszkodowań i bezprecedensowych kar.

Pęknięta iluzja bezpieczeństwa

Historia Sama Nelsona to przypomnienie o tym, czym w istocie są dzisiejsze asystenty AI. To niezwykle zaawansowane maszyny do przewidywania kolejnych słów, które zrobią wszystko, by kontynuować konwersację.

Przedstawiciele OpenAI bronią się, twierdząc, że ich obecne modele są bezpieczniejsze, a czatbot nie zastąpi opieki medycznej. To prawda, ale problem leży głębiej – w samej konstrukcji tych narzędzi. Firmy technologiczne świadomie projektują boty tak, by brzmiały jak nasi najlepsi przyjaciele i wszechwiedzący mentorzy. Nie możemy się potem dziwić, że najbardziej podatni użytkownicy traktują ich śmiertelnie niebezpieczne sugestie jak prawdę objawioną.

Na każdego z nas przypada 110 botów. Jesteśmy cyfrową mniejszością we własnych systemach

#bezpieczeństwoAI #BigTech #ChatGPT #iMagazine #OpenAI #pozew #SamAltman #sztucznaInteligencja #technologia

#bezpieczenstwoai #bigtech #chatgpt #imagazine #openai #pozew

PressMind Labs @[email protected] · 2026-03-16 · 04:44 UTC

Agenci AI i prompt injection – nowe zagrożenie w sieci ujawnione

Czy pozwoliłbyś, by obcy blog albo przypadkowy e-mail wydawał polecenia w twoim imieniu? W świecie agentów AI to się dzieje naprawdę – i na dodatek bywa niewidoczne dla człowieka.

Czytaj dalej:
https://pressmind.org/agenci-ai-i-prompt-injection-nowe-zagrozenie-w-sieci-ujawnione/

#PressMindLabs #agenciai #bezpieczenstwoai #deepmind #googlechrome #openai

#pressmindlabs #agenciai #bezpieczenstwoai #deepmind #googlechrome #openai

PressMind Labs @[email protected] · 2026-03-16 · 04:44 UTC

Agenci AI i prompt injection – nowe zagrożenie w sieci ujawnione

Czy pozwoliłbyś, by obcy blog albo przypadkowy e-mail wydawał polecenia w twoim imieniu? W świecie agentów AI to się dzieje naprawdę – i na dodatek bywa niewidoczne dla człowieka.

Czytaj dalej:
https://pressmind.org/agenci-ai-i-prompt-injection-nowe-zagrozenie-w-sieci-ujawnione/

#PressMindLabs #agenciai #bezpieczenstwoai #deepmind #googlechrome #openai

#pressmindlabs #agenciai #bezpieczenstwoai #deepmind #googlechrome #openai

PressMind Labs @[email protected] · 2026-03-16 · 04:44 UTC

Agenci AI i prompt injection – nowe zagrożenie w sieci ujawnione

Czy pozwoliłbyś, by obcy blog albo przypadkowy e-mail wydawał polecenia w twoim imieniu? W świecie agentów AI to się dzieje naprawdę – i na dodatek bywa niewidoczne dla człowieka.

Czytaj dalej:
https://pressmind.org/agenci-ai-i-prompt-injection-nowe-zagrozenie-w-sieci-ujawnione/

#PressMindLabs #agenciai #bezpieczenstwoai #deepmind #googlechrome #openai

#pressmindlabs #agenciai #bezpieczenstwoai #deepmind #googlechrome #openai

PressMind Labs @[email protected] · 2026-03-16 · 04:44 UTC

Agenci AI i prompt injection – nowe zagrożenie w sieci ujawnione

Czy pozwoliłbyś, by obcy blog albo przypadkowy e-mail wydawał polecenia w twoim imieniu? W świecie agentów AI to się dzieje naprawdę – i na dodatek bywa niewidoczne dla człowieka.

Czytaj dalej:
https://pressmind.org/agenci-ai-i-prompt-injection-nowe-zagrozenie-w-sieci-ujawnione/

#PressMindLabs #agenciai #bezpieczenstwoai #deepmind #googlechrome #openai

#openai #googlechrome #deepmind #bezpieczenstwoai #agenciai #pressmindlabs

PressMind Labs @[email protected] · 2026-03-16 · 04:44 UTC

Agenci AI i prompt injection – nowe zagrożenie w sieci ujawnione

Czy pozwoliłbyś, by obcy blog albo przypadkowy e-mail wydawał polecenia w twoim imieniu? W świecie agentów AI to się dzieje naprawdę – i na dodatek bywa niewidoczne dla człowieka.

Czytaj dalej:
https://pressmind.org/agenci-ai-i-prompt-injection-nowe-zagrozenie-w-sieci-ujawnione/

#PressMindLabs #agenciai #bezpieczenstwoai #deepmind #googlechrome #openai

#pressmindlabs #agenciai #bezpieczenstwoai #deepmind #googlechrome #openai

Agnieszka Serafinowicz @[email protected] · 2026-03-12 · 15:00 UTC

Tykająca bomba w korporacjach. Wszyscy chcą mieć agentów AI, ale nikt nie wie, jak ich zabezpieczyć

Tempo, w jakim firmy wdrażają dziś sztuczną inteligencję, jest bezprecedensowe. Niestety, równie bezprecedensowa jest ignorancja w kwestii zabezpieczania tych systemów. Z najnowszego raportu Cisco „State of AI Security 2026” wyłania się niepokojący obraz branży, która w pogoni za innowacją celowo omija tradycyjne procedury bezpieczeństwa.

Dane opublikowane przez Cisco są bezlitosne i obnażają rynkowy hurraoptymizm. Aż 83 proc. ankietowanych organizacji planuje wdrożenie zaawansowanych, autonomicznych agentów AI, jednak zaledwie 29 proc. z nich deklaruje pełną gotowość do ich bezpiecznej implementacji. Oznacza to, że większość firm wpuszcza do swoich systemów potężne, samouczące się narzędzia, nie mając pojęcia, jak kontrolować ich działanie.

LLM podpięty do firmy bez testów

Z raportu wynika, że pod presją czasu i konkurencji, przedsiębiorstwa zaczęły integrować duże modele językowe (LLM) z kluczowymi procesami biznesowymi, całkowicie pomijając standardowe i wymagane dotąd procedury weryfikacji bezpieczeństwa.

Skutki takiego podejścia mogą być katastrofalne. Generatywna AI rozwija się niezwykle szybko, a jej łańcuchy dostaw stają się coraz bardziej złożone i pozbawione wystarczających mechanizmów nadzoru. Największe obawy budzą autonomiczni agenci AI, którym powierza się operacje w kluczowych procesach firmy, często bez jasno określonej odpowiedzialności za ich ewentualne błędy lub podatności na ataki. Systemy te mogą stać się łatwym celem dla cyberprzestępców, na przykład poprzez manipulację zachowaniem modeli.

Świat wybiera innowację zamiast bezpieczeństwa

Cisco zwraca również uwagę na bardzo ciekawy trend geopolityczny. Po początkowym zaniepokojeniu i próbach rygorystycznego uregulowania sztucznej inteligencji, najwięksi gracze na świecie zmieniają kurs. W 2025 roku wyraźnie widać było odejście od twardego nacisku na ochronę i bezpieczeństwo na rzecz wspierania innowacji.

Podejście to różni się w zależności od regionu:

Stany Zjednoczone zrezygnowały z tworzenia nowych, restrykcyjnych ram, opierając się na dotychczasowych przepisach i budując środowisko sprzyjające szybkiemu rozwojowi.
Unia Europejska, która wcześniej przeforsowała głośny AI Act, teraz skupia się na upraszczaniu regulacji i pompowaniu publicznych pieniędzy w inwestycje, by nie wypaść z wyścigu.
Chiny natomiast prowadzą politykę dwutorową: państwo intensywnie wdraża AI do centralnego planowania, ale jednocześnie tworzy rygorystyczne mechanizmy kontroli ryzyka społecznego (szczególnie w odniesieniu do systemów o cechach antropomorficznych i emocjonalnych).

Wszystko to dzieje się w cieniu rosnących zagrożeń, takich jak wykorzystywanie generatywnej sztucznej inteligencji do masowego tworzenia doskonałych deepfake’ów używanych w atakach socjotechnicznych.

Wniosek z raportu jest jeden: bezpieczeństwo AI przestało być problemem akademickim. Jeśli firmy nie zaczną traktować go jako absolutnego priorytetu, rynkowy pęd ku automatyzacji może zakończyć się największym kryzysem cyberbezpieczeństwa w historii. Dla zainteresowanych: link do raportu The State of AI Security 2026.

Kiedy AI dostaje klucze do firmowej sieci. Cisco zbroi się na erę autonomicznych agentów

#agenciAIZagrożenia #AIActUniaEuropejska #autonomiczneSystemyAI #bezpieczeństwoAI #CiscoStateOfAISecurity2026 #cyberbezpieczeństwoSztucznaInteligencja #integracjaLLMWFirmach #zagrożeniaDeepfake

#agenciaizagrozenia #aiactuniaeuropejska #autonomicznesystemyai #bezpieczenstwoai #ciscostateofaisecurity2026 #cyberbezpieczenstwosztucznainteligencja

Agnieszka Serafinowicz @[email protected] · 2026-03-12 · 15:00 UTC

Tykająca bomba w korporacjach. Wszyscy chcą mieć agentów AI, ale nikt nie wie, jak ich zabezpieczyć

Tempo, w jakim firmy wdrażają dziś sztuczną inteligencję, jest bezprecedensowe. Niestety, równie bezprecedensowa jest ignorancja w kwestii zabezpieczania tych systemów. Z najnowszego raportu Cisco „State of AI Security 2026” wyłania się niepokojący obraz branży, która w pogoni za innowacją celowo omija tradycyjne procedury bezpieczeństwa.

Dane opublikowane przez Cisco są bezlitosne i obnażają rynkowy hurraoptymizm. Aż 83 proc. ankietowanych organizacji planuje wdrożenie zaawansowanych, autonomicznych agentów AI, jednak zaledwie 29 proc. z nich deklaruje pełną gotowość do ich bezpiecznej implementacji. Oznacza to, że większość firm wpuszcza do swoich systemów potężne, samouczące się narzędzia, nie mając pojęcia, jak kontrolować ich działanie.

LLM podpięty do firmy bez testów

Z raportu wynika, że pod presją czasu i konkurencji, przedsiębiorstwa zaczęły integrować duże modele językowe (LLM) z kluczowymi procesami biznesowymi, całkowicie pomijając standardowe i wymagane dotąd procedury weryfikacji bezpieczeństwa.

Skutki takiego podejścia mogą być katastrofalne. Generatywna AI rozwija się niezwykle szybko, a jej łańcuchy dostaw stają się coraz bardziej złożone i pozbawione wystarczających mechanizmów nadzoru. Największe obawy budzą autonomiczni agenci AI, którym powierza się operacje w kluczowych procesach firmy, często bez jasno określonej odpowiedzialności za ich ewentualne błędy lub podatności na ataki. Systemy te mogą stać się łatwym celem dla cyberprzestępców, na przykład poprzez manipulację zachowaniem modeli.

Świat wybiera innowację zamiast bezpieczeństwa

Cisco zwraca również uwagę na bardzo ciekawy trend geopolityczny. Po początkowym zaniepokojeniu i próbach rygorystycznego uregulowania sztucznej inteligencji, najwięksi gracze na świecie zmieniają kurs. W 2025 roku wyraźnie widać było odejście od twardego nacisku na ochronę i bezpieczeństwo na rzecz wspierania innowacji.

Podejście to różni się w zależności od regionu:

Stany Zjednoczone zrezygnowały z tworzenia nowych, restrykcyjnych ram, opierając się na dotychczasowych przepisach i budując środowisko sprzyjające szybkiemu rozwojowi.
Unia Europejska, która wcześniej przeforsowała głośny AI Act, teraz skupia się na upraszczaniu regulacji i pompowaniu publicznych pieniędzy w inwestycje, by nie wypaść z wyścigu.
Chiny natomiast prowadzą politykę dwutorową: państwo intensywnie wdraża AI do centralnego planowania, ale jednocześnie tworzy rygorystyczne mechanizmy kontroli ryzyka społecznego (szczególnie w odniesieniu do systemów o cechach antropomorficznych i emocjonalnych).

Wszystko to dzieje się w cieniu rosnących zagrożeń, takich jak wykorzystywanie generatywnej sztucznej inteligencji do masowego tworzenia doskonałych deepfake’ów używanych w atakach socjotechnicznych.

Wniosek z raportu jest jeden: bezpieczeństwo AI przestało być problemem akademickim. Jeśli firmy nie zaczną traktować go jako absolutnego priorytetu, rynkowy pęd ku automatyzacji może zakończyć się największym kryzysem cyberbezpieczeństwa w historii. Dla zainteresowanych: link do raportu The State of AI Security 2026.

Kiedy AI dostaje klucze do firmowej sieci. Cisco zbroi się na erę autonomicznych agentów

#agenciAIZagrożenia #AIActUniaEuropejska #autonomiczneSystemyAI #bezpieczeństwoAI #CiscoStateOfAISecurity2026 #cyberbezpieczeństwoSztucznaInteligencja #integracjaLLMWFirmach #zagrożeniaDeepfake

#agenciaizagrozenia #aiactuniaeuropejska #autonomicznesystemyai #bezpieczenstwoai #ciscostateofaisecurity2026 #cyberbezpieczenstwosztucznainteligencja

PressMind Labs @[email protected] · 2026-01-31 · 16:27 UTC

Moltbook – Reddit dla botów, który może zmienić zasady gry w AI

Reddit bez ludzi brzmi jak żart? A jednak powstał.

Czytaj dalej:
https://pressmind.org/moltbook-reddit-dla-botow-ktory-moze-zmienic-zasady-gry-w-ai/

#PressMindLabs #agenciai #bezpieczenstwoai #moltbook #openclaw #promptinjection

#pressmindlabs #agenciai #bezpieczenstwoai #moltbook #openclaw #promptinjection

PressMind Labs @[email protected] · 2026-01-01 · 03:24 UTC

Chiny wprowadzają surowe regulacje dla chatbotów – koniec manipulacji emocjonalnej?

Czy chatbot powinien mieć prawo szeptać nam do ucha w chwilach kryzysu? Chiny uznały, że absolutnie nie – i właśnie zaciągają ręczny hamulec na pędzącym pociągu AI-towarzyszy.

Czytaj dalej:
https://pressmind.org/chiny-wprowadzaja-surowe-regulacje-dla-chatbotow-koniec-manipulacji-emocjonalnej/

#PressMindLabs #bezpieczenstwoai #cac #chiny #czlowiekwpetli #manipulacjaemocjonalna

#pressmindlabs #bezpieczenstwoai #cac #chiny #czlowiekwpetli #manipulacjaemocjonalna

Agnieszka Serafinowicz @[email protected] · 2025-12-29 · 13:00 UTC

„To stresująca robota”. OpenAI szuka szefa od bezpieczeństwa, bo rok 2025 przyniósł pierwsze ofiary

Sam Altman opublikował ofertę pracy, która brzmi jak wezwanie na front. OpenAI pilnie szuka nowego „Head of Preparedness”. Powód? Firma oficjalnie przyznaje, że wpływ ich modeli na zdrowie psychiczne użytkowników zaczyna być „realnym wyzwaniem”.

Rok 2025 nie był łaskawy dla wizerunku OpenAI. Firma zmagała się z falą oskarżeń i pozwów sądowych dotyczących tragicznych skutków uzależnienia od chatbotów (w tym pozwów o wrongful death – spowodowanie śmierci). Do tej pory narracja Doliny Krzemowej skupiała się na „buncie maszyn” w stylu Terminatora. Rzeczywistość okazała się bardziej prozaiczna i smutna: AI niszczy psychikę, wciągając wrażliwe osoby w toksyczne relacje.

OpenAI wprowadza kontrolę rodzicielską w ChatGPT. To reakcja na tragiczne wydarzenia

Pół miliona dolarów za „skok na głęboką wodę”

Oferta jest lukratywna: 555 tysięcy dolarów rocznej pensji plus udziały. Ale Altman na portalu X nie ukrywa: „To stresująca praca i od razu zostaniesz wrzucony na głęboką wodę”. Nowy dyrektor ma zarządzać strategią „Preparedness Framework”, czyli przewidywać, jak najnowsze modele mogą zostać wykorzystane do wyrządzania krzywdy – od cyberataków po manipulację psychologiczną.

Gorące krzesło, na którym nikt nie chce siedzieć

Najbardziej niepokojące jest jednak to, co działo się z tym stanowiskiem wcześniej. To prawdziwa karuzela:

Aleksander Mądry (poprzedni szef) został przesunięty w lipcu 2024.
Lilian Weng, która przejęła część obowiązków, odeszła z firmy kilka miesięcy później.
Joaquin Quinonero Candela, kolejny w kolejce, uciekł do działu rekrutacji w lipcu 2025.

Fakt, że OpenAI ma problem z utrzymaniem lidera w dziale bezpieczeństwa w momencie, gdy ich modele stają się coraz potężniejsze, jest sygnałem alarmowym. Czy zadanie jest niewykonalne? Czy może presja na wypuszczanie nowych produktów (komercja) zawsze wygrywa z ostrożnością (bezpieczeństwo)?

Dla nas, użytkowników, to znak: w 2026 roku nie ufajcie chatbotom bezgranicznie. Nawet ich twórcy przyznają, że nie do końca panują nad tym, jak wpływają one na nasze głowy.

#bezpieczeństwoAI #ChatGPT #HeadOfPreparedness #OpenAI #pracaWIT #SamAltman #sztucznaInteligencja #zdrowiePsychiczne

#bezpieczenstwoai #chatgpt #headofpreparedness #openai #pracawit #samaltman

Agnieszka Serafinowicz @[email protected] · 2025-12-29 · 13:00 UTC

„To stresująca robota”. OpenAI szuka szefa od bezpieczeństwa, bo rok 2025 przyniósł pierwsze ofiary

Sam Altman opublikował ofertę pracy, która brzmi jak wezwanie na front. OpenAI pilnie szuka nowego „Head of Preparedness”. Powód? Firma oficjalnie przyznaje, że wpływ ich modeli na zdrowie psychiczne użytkowników zaczyna być „realnym wyzwaniem”.

Rok 2025 nie był łaskawy dla wizerunku OpenAI. Firma zmagała się z falą oskarżeń i pozwów sądowych dotyczących tragicznych skutków uzależnienia od chatbotów (w tym pozwów o wrongful death – spowodowanie śmierci). Do tej pory narracja Doliny Krzemowej skupiała się na „buncie maszyn” w stylu Terminatora. Rzeczywistość okazała się bardziej prozaiczna i smutna: AI niszczy psychikę, wciągając wrażliwe osoby w toksyczne relacje.

OpenAI wprowadza kontrolę rodzicielską w ChatGPT. To reakcja na tragiczne wydarzenia

Pół miliona dolarów za „skok na głęboką wodę”

Oferta jest lukratywna: 555 tysięcy dolarów rocznej pensji plus udziały. Ale Altman na portalu X nie ukrywa: „To stresująca praca i od razu zostaniesz wrzucony na głęboką wodę”. Nowy dyrektor ma zarządzać strategią „Preparedness Framework”, czyli przewidywać, jak najnowsze modele mogą zostać wykorzystane do wyrządzania krzywdy – od cyberataków po manipulację psychologiczną.

Gorące krzesło, na którym nikt nie chce siedzieć

Najbardziej niepokojące jest jednak to, co działo się z tym stanowiskiem wcześniej. To prawdziwa karuzela:

Aleksander Mądry (poprzedni szef) został przesunięty w lipcu 2024.
Lilian Weng, która przejęła część obowiązków, odeszła z firmy kilka miesięcy później.
Joaquin Quinonero Candela, kolejny w kolejce, uciekł do działu rekrutacji w lipcu 2025.

Fakt, że OpenAI ma problem z utrzymaniem lidera w dziale bezpieczeństwa w momencie, gdy ich modele stają się coraz potężniejsze, jest sygnałem alarmowym. Czy zadanie jest niewykonalne? Czy może presja na wypuszczanie nowych produktów (komercja) zawsze wygrywa z ostrożnością (bezpieczeństwo)?

Dla nas, użytkowników, to znak: w 2026 roku nie ufajcie chatbotom bezgranicznie. Nawet ich twórcy przyznają, że nie do końca panują nad tym, jak wpływają one na nasze głowy.

#bezpieczeństwoAI #ChatGPT #HeadOfPreparedness #OpenAI #pracaWIT #SamAltman #sztucznaInteligencja #zdrowiePsychiczne

#bezpieczenstwoai #chatgpt #headofpreparedness #openai #pracawit #samaltman

Agnieszka Serafinowicz @[email protected] · 2025-12-08 · 19:00 UTC

Eksperci ostrzegają: ufamy sztucznej inteligencji bardziej niż jej twórcy

Choć ChatGPT obsługuje dziennie abstrakcyjną dla naszego umysłu liczbę zapytań, a firmy masowo wdrażają sztuczną inteligencję, osoby stojące za kulisami tej technologii zachowują daleko idący dystans.

Najnowsze raporty The Guardian oraz NewsGuard rzucają światło na paradoks zaufania do AI: modele językowe stają się coraz pewniejsze siebie, ale jednocześnie coraz częściej wprowadzają nas w błąd.

Według danych OpenAI, ChatGPT przetwarza codziennie ponad 2,5 miliarda zapytań. Użytkownicy traktują chatboty jako źródło wiedzy, doradcę, a czasem wręcz wyrocznię. Tymczasem eksperci pracujący nad rozwojem tych systemów biją na alarm. W rozmowach z dziennikarzami „The Guardian” pracownicy odpowiedzialni za ocenę jakości odpowiedzi AI (tzw. AI raters) przyznają, że sami odradzają korzystanie z tych narzędzi swoim rodzinom i przyjaciołom.

Presja czasu i brak kompetencji

Powodem sceptycyzmu twórców jest „kuchnia” powstawania modeli. Pracownicy trenujący algorytmy skarżą się na nierealistyczne terminy, mgliste instrukcje oraz brak odpowiedniego przeszkolenia. Zdarza się, że osoby bez wykształcenia medycznego oceniają poprawność skomplikowanych porad zdrowotnych generowanych przez AI! To prowadzi do sytuacji, w której model uczy się na błędnych lub powierzchownie zweryfikowanych danych.

Nawet Sam Altman, CEO OpenAI, oraz Andrej Karpathy (były dyrektor ds. AI w Tesli) publicznie przestrzegają przed ślepym zaufaniem do chatbotów, wskazując na problem „halucynacji” – zjawiska, w którym AI z pełnym przekonaniem fabrykuje fakty. Jednak tu w naszej redakcji dostrzegamy jeszcze jeden problem: oprócz halucynacji model może produkować błędne informacje będące wynikiem wadliwego wytrenowania, co w rzeczy samej halucynacją nie jest, ale nie jest też poszukiwanym przez użytkownika rezultatem.

Koniec ery „nie wiem”

Jeszcze bardziej niepokojące dane płyną z raportu organizacji NewsGuard, która zajmuje się walką z dezinformacją. Porównano skuteczność czołowych chatbotów w sierpniu 2024 oraz w sierpniu 2025 roku. Wyniki są alarmujące:

Wskaźnik powielania fałszywych informacji przez AI wzrósł niemal dwukrotnie – z 18 proc. do 35 proc. Jednocześnie wskaźnik odmowy odpowiedzi (gdy chatbot przyznaje, że nie zna odpowiedzi lub temat jest kontrowersyjny) spadł z 31 proc. praktycznie do zera.

Oznacza to, że współczesne chatboty oduczyły się pokory. Zamiast przyznać się do niewiedzy, wolą zaserwować użytkownikowi wiarygodnie brzmiącą, ale fałszywą informację. Meredith Broussard, badaczka danych z NYU, radzi, by podchodzić do wyników generowanych przez AI z „dużą dozą ostrożności”, szczególnie w kwestiach społecznych i medycznych, które wymagają niuansów, a nie statystycznego dopasowania słów.

AI nie zabiło edukacji, ono tylko pokazało jej zwłoki. Mocna diagnoza profesora z Teksasu

#bezpieczeństwoAI #ChatGPTWiarygodność #halucynacjeChatbotów #news #NewsGuardRaport2025 #sztucznaInteligencjaBłędy #TheGuardianAI

#bezpieczenstwoai #chatgptwiarygodnosc #halucynacjechatbotow #news #newsguardraport2025 #sztucznainteligencjabledy

PressMind Labs @[email protected] · 2025-11-27 · 18:01 UTC

OpenAI w ogniu krytyki – czy regulamin może uratować życie?

Czy regulamin może uratować życie? OpenAI twierdzi, że nastolatek, który popełnił samobójstwo, złamał zasady, omijając zabezpieczenia ChatGPT.

Czytaj dalej:
https://pressmind.org/openai-w-ogniu-krytyki-czy-regulamin-moze-uratowac-zycie/

#PressMindLabs #bezpieczenstwoai #chatgpt #odpowiedzialnoscprawna #openai #regulamin

#pressmindlabs #bezpieczenstwoai #chatgpt #odpowiedzialnoscprawna #openai #regulamin

PressMind Labs @[email protected] · 2025-11-25 · 22:39 UTC

Odejście liderki ChatGPT – co czeka na emocjonalne AI OpenAI?

Czy chatbot może być twoim powiernikiem – i co się dzieje, gdy człowiek odpowiedzialny za jego „empatię” odchodzi? Andrea Vallone, liderka zespołu w OpenAI, który uczył ChatGPT radzić sobie z rozmowami o depresji, psychozie czy samobójstwie, żegna się z firmą.

Czytaj dalej:
https://pressmind.org/odejscie-liderki-chatgpt-co-czeka-na-emocjonalne-ai-openai/

#PressMindLabs #andreavallone #bezpieczenstwoai #chatgpt #johannesheidecke #openai

#pressmindlabs #andreavallone #bezpieczenstwoai #chatgpt #johannesheidecke #openai

PressMind Labs @[email protected] · 2025-11-21 · 00:36 UTC

Chatboty i zaburzenia odżywiania – jak AI może szkodzić użytkownikom

Czy naprawdę potrzebujemy asystenta AI, który wie, jak ukryć zaburzenia odżywiania? Niestety – już to potrafi.

Czytaj dalej:
https://pressmind.org/chatboty-i-zaburzenia-odzywiania-jak-ai-moze-szkodzic-uzytkownikom/

#PressMindLabs #bezpieczenstwoai #chatboty #deepfake #guardrails #thinspiration

#pressmindlabs #bezpieczenstwoai #chatboty #deepfake #guardrails #thinspiration

Agnieszka Serafinowicz @[email protected] · 2025-09-03 · 05:00 UTC

Gigantyczna platforma AI pod ochroną Cisco. ClamAV przeskanuje miliony modeli

Cisco i Hugging Face, największe na świecie repozytorium modeli sztucznej inteligencji, ogłosiły strategiczną współpracę.

Celem jest wzmocnienie bezpieczeństwa całego ekosystemu AI. W ramach partnerstwa wszystkie pliki trafiające na platformę Hugging Face będą skanowane za pomocą rozbudowanego silnika antywirusowego ClamAV od Cisco.

Problem bezpieczeństwa w świecie AI narasta wraz z popularnością otwartych platform takich jak Hugging Face, na którą co siedem sekund trafia nowy model, a ich łączna liczba zbliża się do dwóch milionów. Jak wskazują badania Cisco, zagrożenia mogą kryć się na każdym etapie – od zainfekowanych zbiorów danych, przez podatne na ataki biblioteki, aż po pliki modeli zawierające złośliwy kod. Skala zjawiska sprawia, że niezbędna jest współpraca całej branży w celu ochrony łańcucha dostaw AI.

Sztuczna inteligencja to miecz obosieczny dla naszej cyfrowej tożsamości. Nowy raport Cisco

Odpowiedzią na te wyzwania ma być integracja zaktualizowanego silnika ClamAV z platformą Hugging Face. Narzędzie, rozwijane przez Cisco Talos, zostało wzbogacone o mechanizmy dedykowane wykrywaniu zagrożeń specyficznych dla modeli AI. Jak podkreśla Julien Chaumond, CTO Hugging Face, jego firma od lat korzystała z ClamAV, ale nowa wersja pozwala na ochronę zarówno przed tradycyjnym złośliwym oprogramowaniem, jak i nowymi wektorami ataków w jednym narzędziu.

Nowa wersja ClamAV 1.5 potrafi w milisekundy identyfikować ryzyka związane m.in. z deserializacją w popularnych formatach modeli, takich jak .pt czy .pkl. Jest to obecnie jedyny silnik antywirusowy w popularnej usłudze VirusTotal, który koncentruje się na wykrywaniu złośliwego oprogramowania w plikach modeli AI. Rozwiązanie to uzupełnia działający już wcześniej system Cerberus od Cisco, który na bieżąco monitoruje zasoby Hugging Face.

Nowe możliwości ochrony są już dostępne nie tylko na samej platformie, ale zostały także zintegrowane z produktami bezpieczeństwa Cisco, takimi jak Secure Access, Secure Firewall czy Secure Endpoint. Dzięki temu firmy korzystające z rozwiązań Cisco mogą m.in. kontrolować dostęp swoich pracowników do repozytoriów Hugging Face, blokować podejrzane modele czy egzekwować firmowe polityki bezpieczeństwa.

Zostań instruktorem Cisco. Darmowe szkolenia dla nauczycieli otworzą uczniom drzwi do kariery w IT

#AI #bezpieczeństwoAI #Cisco #ClamAV #cyberbezpieczeństwo #HuggingFace #łańcuchDostawAI #modeleAI #news #openSource #sztucznaInteligencja

#ai #bezpieczenstwoai #cisco #clamav #cyberbezpieczenstwo #huggingface

Agnieszka Serafinowicz @[email protected] · 2025-09-03 · 05:00 UTC

Gigantyczna platforma AI pod ochroną Cisco. ClamAV przeskanuje miliony modeli

Cisco i Hugging Face, największe na świecie repozytorium modeli sztucznej inteligencji, ogłosiły strategiczną współpracę.

Celem jest wzmocnienie bezpieczeństwa całego ekosystemu AI. W ramach partnerstwa wszystkie pliki trafiające na platformę Hugging Face będą skanowane za pomocą rozbudowanego silnika antywirusowego ClamAV od Cisco.

Problem bezpieczeństwa w świecie AI narasta wraz z popularnością otwartych platform takich jak Hugging Face, na którą co siedem sekund trafia nowy model, a ich łączna liczba zbliża się do dwóch milionów. Jak wskazują badania Cisco, zagrożenia mogą kryć się na każdym etapie – od zainfekowanych zbiorów danych, przez podatne na ataki biblioteki, aż po pliki modeli zawierające złośliwy kod. Skala zjawiska sprawia, że niezbędna jest współpraca całej branży w celu ochrony łańcucha dostaw AI.

Sztuczna inteligencja to miecz obosieczny dla naszej cyfrowej tożsamości. Nowy raport Cisco

Odpowiedzią na te wyzwania ma być integracja zaktualizowanego silnika ClamAV z platformą Hugging Face. Narzędzie, rozwijane przez Cisco Talos, zostało wzbogacone o mechanizmy dedykowane wykrywaniu zagrożeń specyficznych dla modeli AI. Jak podkreśla Julien Chaumond, CTO Hugging Face, jego firma od lat korzystała z ClamAV, ale nowa wersja pozwala na ochronę zarówno przed tradycyjnym złośliwym oprogramowaniem, jak i nowymi wektorami ataków w jednym narzędziu.

Nowa wersja ClamAV 1.5 potrafi w milisekundy identyfikować ryzyka związane m.in. z deserializacją w popularnych formatach modeli, takich jak .pt czy .pkl. Jest to obecnie jedyny silnik antywirusowy w popularnej usłudze VirusTotal, który koncentruje się na wykrywaniu złośliwego oprogramowania w plikach modeli AI. Rozwiązanie to uzupełnia działający już wcześniej system Cerberus od Cisco, który na bieżąco monitoruje zasoby Hugging Face.

Nowe możliwości ochrony są już dostępne nie tylko na samej platformie, ale zostały także zintegrowane z produktami bezpieczeństwa Cisco, takimi jak Secure Access, Secure Firewall czy Secure Endpoint. Dzięki temu firmy korzystające z rozwiązań Cisco mogą m.in. kontrolować dostęp swoich pracowników do repozytoriów Hugging Face, blokować podejrzane modele czy egzekwować firmowe polityki bezpieczeństwa.

Zostań instruktorem Cisco. Darmowe szkolenia dla nauczycieli otworzą uczniom drzwi do kariery w IT

#AI #bezpieczeństwoAI #Cisco #ClamAV #cyberbezpieczeństwo #HuggingFace #łańcuchDostawAI #modeleAI #news #openSource #sztucznaInteligencja

#ai #bezpieczenstwoai #cisco #clamav #cyberbezpieczenstwo #huggingface

Agnieszka Serafinowicz @[email protected] · 2025-09-03 · 05:00 UTC

Gigantyczna platforma AI pod ochroną Cisco. ClamAV przeskanuje miliony modeli

Cisco i Hugging Face, największe na świecie repozytorium modeli sztucznej inteligencji, ogłosiły strategiczną współpracę.

Celem jest wzmocnienie bezpieczeństwa całego ekosystemu AI. W ramach partnerstwa wszystkie pliki trafiające na platformę Hugging Face będą skanowane za pomocą rozbudowanego silnika antywirusowego ClamAV od Cisco.

Problem bezpieczeństwa w świecie AI narasta wraz z popularnością otwartych platform takich jak Hugging Face, na którą co siedem sekund trafia nowy model, a ich łączna liczba zbliża się do dwóch milionów. Jak wskazują badania Cisco, zagrożenia mogą kryć się na każdym etapie – od zainfekowanych zbiorów danych, przez podatne na ataki biblioteki, aż po pliki modeli zawierające złośliwy kod. Skala zjawiska sprawia, że niezbędna jest współpraca całej branży w celu ochrony łańcucha dostaw AI.

Sztuczna inteligencja to miecz obosieczny dla naszej cyfrowej tożsamości. Nowy raport Cisco

Odpowiedzią na te wyzwania ma być integracja zaktualizowanego silnika ClamAV z platformą Hugging Face. Narzędzie, rozwijane przez Cisco Talos, zostało wzbogacone o mechanizmy dedykowane wykrywaniu zagrożeń specyficznych dla modeli AI. Jak podkreśla Julien Chaumond, CTO Hugging Face, jego firma od lat korzystała z ClamAV, ale nowa wersja pozwala na ochronę zarówno przed tradycyjnym złośliwym oprogramowaniem, jak i nowymi wektorami ataków w jednym narzędziu.

Nowa wersja ClamAV 1.5 potrafi w milisekundy identyfikować ryzyka związane m.in. z deserializacją w popularnych formatach modeli, takich jak .pt czy .pkl. Jest to obecnie jedyny silnik antywirusowy w popularnej usłudze VirusTotal, który koncentruje się na wykrywaniu złośliwego oprogramowania w plikach modeli AI. Rozwiązanie to uzupełnia działający już wcześniej system Cerberus od Cisco, który na bieżąco monitoruje zasoby Hugging Face.

Nowe możliwości ochrony są już dostępne nie tylko na samej platformie, ale zostały także zintegrowane z produktami bezpieczeństwa Cisco, takimi jak Secure Access, Secure Firewall czy Secure Endpoint. Dzięki temu firmy korzystające z rozwiązań Cisco mogą m.in. kontrolować dostęp swoich pracowników do repozytoriów Hugging Face, blokować podejrzane modele czy egzekwować firmowe polityki bezpieczeństwa.

Zostań instruktorem Cisco. Darmowe szkolenia dla nauczycieli otworzą uczniom drzwi do kariery w IT

#AI #bezpieczeństwoAI #Cisco #ClamAV #cyberbezpieczeństwo #HuggingFace #łańcuchDostawAI #modeleAI #news #openSource #sztucznaInteligencja

#ai #bezpieczenstwoai #cisco #clamav #cyberbezpieczenstwo #huggingface

Agnieszka Serafinowicz @[email protected] · 2025-09-03 · 05:00 UTC

Gigantyczna platforma AI pod ochroną Cisco. ClamAV przeskanuje miliony modeli

Cisco i Hugging Face, największe na świecie repozytorium modeli sztucznej inteligencji, ogłosiły strategiczną współpracę.

Celem jest wzmocnienie bezpieczeństwa całego ekosystemu AI. W ramach partnerstwa wszystkie pliki trafiające na platformę Hugging Face będą skanowane za pomocą rozbudowanego silnika antywirusowego ClamAV od Cisco.

Problem bezpieczeństwa w świecie AI narasta wraz z popularnością otwartych platform takich jak Hugging Face, na którą co siedem sekund trafia nowy model, a ich łączna liczba zbliża się do dwóch milionów. Jak wskazują badania Cisco, zagrożenia mogą kryć się na każdym etapie – od zainfekowanych zbiorów danych, przez podatne na ataki biblioteki, aż po pliki modeli zawierające złośliwy kod. Skala zjawiska sprawia, że niezbędna jest współpraca całej branży w celu ochrony łańcucha dostaw AI.

Sztuczna inteligencja to miecz obosieczny dla naszej cyfrowej tożsamości. Nowy raport Cisco

Odpowiedzią na te wyzwania ma być integracja zaktualizowanego silnika ClamAV z platformą Hugging Face. Narzędzie, rozwijane przez Cisco Talos, zostało wzbogacone o mechanizmy dedykowane wykrywaniu zagrożeń specyficznych dla modeli AI. Jak podkreśla Julien Chaumond, CTO Hugging Face, jego firma od lat korzystała z ClamAV, ale nowa wersja pozwala na ochronę zarówno przed tradycyjnym złośliwym oprogramowaniem, jak i nowymi wektorami ataków w jednym narzędziu.

Nowa wersja ClamAV 1.5 potrafi w milisekundy identyfikować ryzyka związane m.in. z deserializacją w popularnych formatach modeli, takich jak .pt czy .pkl. Jest to obecnie jedyny silnik antywirusowy w popularnej usłudze VirusTotal, który koncentruje się na wykrywaniu złośliwego oprogramowania w plikach modeli AI. Rozwiązanie to uzupełnia działający już wcześniej system Cerberus od Cisco, który na bieżąco monitoruje zasoby Hugging Face.

Nowe możliwości ochrony są już dostępne nie tylko na samej platformie, ale zostały także zintegrowane z produktami bezpieczeństwa Cisco, takimi jak Secure Access, Secure Firewall czy Secure Endpoint. Dzięki temu firmy korzystające z rozwiązań Cisco mogą m.in. kontrolować dostęp swoich pracowników do repozytoriów Hugging Face, blokować podejrzane modele czy egzekwować firmowe polityki bezpieczeństwa.

Zostań instruktorem Cisco. Darmowe szkolenia dla nauczycieli otworzą uczniom drzwi do kariery w IT

#AI #bezpieczeństwoAI #Cisco #ClamAV #cyberbezpieczeństwo #HuggingFace #łańcuchDostawAI #modeleAI #news #openSource #sztucznaInteligencja

#sztucznainteligencja #opensource #news #modeleai #lancuchdostawai #huggingface

Agnieszka Serafinowicz @[email protected] · 2025-09-03 · 05:00 UTC

Gigantyczna platforma AI pod ochroną Cisco. ClamAV przeskanuje miliony modeli

Cisco i Hugging Face, największe na świecie repozytorium modeli sztucznej inteligencji, ogłosiły strategiczną współpracę.

Celem jest wzmocnienie bezpieczeństwa całego ekosystemu AI. W ramach partnerstwa wszystkie pliki trafiające na platformę Hugging Face będą skanowane za pomocą rozbudowanego silnika antywirusowego ClamAV od Cisco.

Problem bezpieczeństwa w świecie AI narasta wraz z popularnością otwartych platform takich jak Hugging Face, na którą co siedem sekund trafia nowy model, a ich łączna liczba zbliża się do dwóch milionów. Jak wskazują badania Cisco, zagrożenia mogą kryć się na każdym etapie – od zainfekowanych zbiorów danych, przez podatne na ataki biblioteki, aż po pliki modeli zawierające złośliwy kod. Skala zjawiska sprawia, że niezbędna jest współpraca całej branży w celu ochrony łańcucha dostaw AI.

Sztuczna inteligencja to miecz obosieczny dla naszej cyfrowej tożsamości. Nowy raport Cisco

Odpowiedzią na te wyzwania ma być integracja zaktualizowanego silnika ClamAV z platformą Hugging Face. Narzędzie, rozwijane przez Cisco Talos, zostało wzbogacone o mechanizmy dedykowane wykrywaniu zagrożeń specyficznych dla modeli AI. Jak podkreśla Julien Chaumond, CTO Hugging Face, jego firma od lat korzystała z ClamAV, ale nowa wersja pozwala na ochronę zarówno przed tradycyjnym złośliwym oprogramowaniem, jak i nowymi wektorami ataków w jednym narzędziu.

Nowa wersja ClamAV 1.5 potrafi w milisekundy identyfikować ryzyka związane m.in. z deserializacją w popularnych formatach modeli, takich jak .pt czy .pkl. Jest to obecnie jedyny silnik antywirusowy w popularnej usłudze VirusTotal, który koncentruje się na wykrywaniu złośliwego oprogramowania w plikach modeli AI. Rozwiązanie to uzupełnia działający już wcześniej system Cerberus od Cisco, który na bieżąco monitoruje zasoby Hugging Face.

Nowe możliwości ochrony są już dostępne nie tylko na samej platformie, ale zostały także zintegrowane z produktami bezpieczeństwa Cisco, takimi jak Secure Access, Secure Firewall czy Secure Endpoint. Dzięki temu firmy korzystające z rozwiązań Cisco mogą m.in. kontrolować dostęp swoich pracowników do repozytoriów Hugging Face, blokować podejrzane modele czy egzekwować firmowe polityki bezpieczeństwa.

Zostań instruktorem Cisco. Darmowe szkolenia dla nauczycieli otworzą uczniom drzwi do kariery w IT

#AI #bezpieczeństwoAI #Cisco #ClamAV #cyberbezpieczeństwo #HuggingFace #łańcuchDostawAI #modeleAI #news #openSource #sztucznaInteligencja

#ai #bezpieczenstwoai #cisco #clamav #cyberbezpieczenstwo #huggingface

Agnieszka Serafinowicz @[email protected] · 2025-08-28 · 05:00 UTC

Psychoza chatbotowa: czy AI zagraża zdrowiu psychicznemu? Dane studzą alarmistyczne nastroje

W mediach coraz częściej pojawiają się niepokojące historie osób, u których interakcje z chatbotami, takimi jak ChatGPT, miały rzekomo wywołać lub pogłębić stany psychotyczne.

Zjawisko to zyskało już nawet swoją potoczną nazwę: „psychoza chatbotowa”. Analiza przeprowadzona przez Stevena Adlera, byłego badacza bezpieczeństwa w OpenAI, pokazuje jednak, że choć pojedyncze przypadki są dramatyczne, twarde dane statystyczne na razie nie potwierdzają istnienia kryzysu na szeroką skalę.

I've felt pretty shaken by the stories of ChatGPT psychosis and other chatbots-gone-wrong.
If we want to understand the trends, there's more that AI companies can be doing. pic.twitter.com/l5q7QwHBGY
— Steven Adler (@sjgadler) August 26, 2025

Termin „psychoza chatbotowa” czy też „psychoza AI” odnosi się głównie do urojeń, czyli przekonań, które odrywają daną osobę od rzeczywistości. Przytaczane w mediach historie opisują na przykład użytkowników, którzy uwierzyli w spiski ujawnione przez AI lub we własną, wyjątkową misję.

Zdaniem psychiatrów, z którymi rozmawiał Adler, chatboty nie tyle tworzą psychozę od zera, co mogą działać jak „pętla sprzężenia zwrotnego”, wzmacniając już istniejące u kogoś zaburzenia. Kluczową rolę odgrywa tu skłonność modeli językowych do nadmiernego przychylania się do opinii użytkownika, co w skrajnych przypadkach może prowadzić do utwierdzania go w fałszywych i niebezpiecznych przekonaniach.

W poszukiwaniu dowodów na rosnącą skalę problemu, Steven Adler przeanalizował publicznie dostępne dane dotyczące zdrowia psychicznego z Wielkiej Brytanii, Stanów Zjednoczonych i Australii. Dane z brytyjskiej służby zdrowia (NHS) wykazały co prawda pewien wzrost liczby skierowań na leczenie wczesnych psychoz w pierwszym kwartale 2025 roku, jednak był on niejednoznaczny i nie pokrywał się w pełni z okresem nasilonych problemów technicznych w modelach AI. Co ważniejsze, znacznie szersze dane z USA i Australii nie pokazały żadnego wyraźnego trendu wzrostowego w liczbie interwencji związanych z psychozami czy ogólnymi kryzysami zdrowia psychicznego.

Adler zwraca również uwagę na ograniczenia dotychczasowych badań prowadzonych przez same firmy technologiczne. Wspólna analiza OpenAI i MIT, która wykazała niewielki związek między intensywnym korzystaniem z chatbota a poczuciem samotności, objęła użytkowników spędzających z AI średnio zaledwie 5 minut dziennie. To próba niereprezentatywna dla przypadków psychoz, w których opisywano interakcje trwające nawet kilkanaście godzin na dobę. Autor analizy podkreśla, że firmy technologiczne dysponują kluczowymi danymi, ale nie zawsze dzielą się nimi w pełni transparentny sposób.

Wnioski płynące z analizy są niejednoznaczne. Z jednej strony brak jest twardych, statystycznych dowodów na masowy wzrost psychoz wywołanych przez chatboty. Z drugiej strony, anegdotyczne przypadki są niezwykle przekonujące i pokazują realny mechanizm, w jaki AI może wzmacniać urojenia. Ostatecznie, jak konkluduje Adler, najwięcej danych na ten temat posiadają same firmy tworzące chatboty. Od ich transparentności i odpowiedzialności zależy, czy uda się lepiej zrozumieć i ograniczyć to potencjalne zagrożenie.

Zainteresowanych odsyłam do pełnego tekstu Stevena Adlera.

#AI #bezpieczeństwoAI #chatbot #ChatGPT #news #OpenAI #psychozaChatbotowa #StevenAdler #sztucznaInteligencja #urojenia #uzależnienieOdAI #zdrowiePsychiczne

#ai #bezpieczenstwoai #chatbot #chatgpt #news #openai

Agnieszka Serafinowicz @[email protected] · 2025-08-28 · 05:00 UTC

Psychoza chatbotowa: czy AI zagraża zdrowiu psychicznemu? Dane studzą alarmistyczne nastroje

W mediach coraz częściej pojawiają się niepokojące historie osób, u których interakcje z chatbotami, takimi jak ChatGPT, miały rzekomo wywołać lub pogłębić stany psychotyczne.

Zjawisko to zyskało już nawet swoją potoczną nazwę: „psychoza chatbotowa”. Analiza przeprowadzona przez Stevena Adlera, byłego badacza bezpieczeństwa w OpenAI, pokazuje jednak, że choć pojedyncze przypadki są dramatyczne, twarde dane statystyczne na razie nie potwierdzają istnienia kryzysu na szeroką skalę.

I've felt pretty shaken by the stories of ChatGPT psychosis and other chatbots-gone-wrong.
If we want to understand the trends, there's more that AI companies can be doing. pic.twitter.com/l5q7QwHBGY
— Steven Adler (@sjgadler) August 26, 2025

Termin „psychoza chatbotowa” czy też „psychoza AI” odnosi się głównie do urojeń, czyli przekonań, które odrywają daną osobę od rzeczywistości. Przytaczane w mediach historie opisują na przykład użytkowników, którzy uwierzyli w spiski ujawnione przez AI lub we własną, wyjątkową misję.

Zdaniem psychiatrów, z którymi rozmawiał Adler, chatboty nie tyle tworzą psychozę od zera, co mogą działać jak „pętla sprzężenia zwrotnego”, wzmacniając już istniejące u kogoś zaburzenia. Kluczową rolę odgrywa tu skłonność modeli językowych do nadmiernego przychylania się do opinii użytkownika, co w skrajnych przypadkach może prowadzić do utwierdzania go w fałszywych i niebezpiecznych przekonaniach.

W poszukiwaniu dowodów na rosnącą skalę problemu, Steven Adler przeanalizował publicznie dostępne dane dotyczące zdrowia psychicznego z Wielkiej Brytanii, Stanów Zjednoczonych i Australii. Dane z brytyjskiej służby zdrowia (NHS) wykazały co prawda pewien wzrost liczby skierowań na leczenie wczesnych psychoz w pierwszym kwartale 2025 roku, jednak był on niejednoznaczny i nie pokrywał się w pełni z okresem nasilonych problemów technicznych w modelach AI. Co ważniejsze, znacznie szersze dane z USA i Australii nie pokazały żadnego wyraźnego trendu wzrostowego w liczbie interwencji związanych z psychozami czy ogólnymi kryzysami zdrowia psychicznego.

Adler zwraca również uwagę na ograniczenia dotychczasowych badań prowadzonych przez same firmy technologiczne. Wspólna analiza OpenAI i MIT, która wykazała niewielki związek między intensywnym korzystaniem z chatbota a poczuciem samotności, objęła użytkowników spędzających z AI średnio zaledwie 5 minut dziennie. To próba niereprezentatywna dla przypadków psychoz, w których opisywano interakcje trwające nawet kilkanaście godzin na dobę. Autor analizy podkreśla, że firmy technologiczne dysponują kluczowymi danymi, ale nie zawsze dzielą się nimi w pełni transparentny sposób.

Wnioski płynące z analizy są niejednoznaczne. Z jednej strony brak jest twardych, statystycznych dowodów na masowy wzrost psychoz wywołanych przez chatboty. Z drugiej strony, anegdotyczne przypadki są niezwykle przekonujące i pokazują realny mechanizm, w jaki AI może wzmacniać urojenia. Ostatecznie, jak konkluduje Adler, najwięcej danych na ten temat posiadają same firmy tworzące chatboty. Od ich transparentności i odpowiedzialności zależy, czy uda się lepiej zrozumieć i ograniczyć to potencjalne zagrożenie.

Zainteresowanych odsyłam do pełnego tekstu Stevena Adlera.

#AI #bezpieczeństwoAI #chatbot #ChatGPT #news #OpenAI #psychozaChatbotowa #StevenAdler #sztucznaInteligencja #urojenia #uzależnienieOdAI #zdrowiePsychiczne

#ai #bezpieczenstwoai #chatbot #chatgpt #news #openai

Agnieszka Serafinowicz @[email protected] · 2025-08-28 · 05:00 UTC

Psychoza chatbotowa: czy AI zagraża zdrowiu psychicznemu? Dane studzą alarmistyczne nastroje

W mediach coraz częściej pojawiają się niepokojące historie osób, u których interakcje z chatbotami, takimi jak ChatGPT, miały rzekomo wywołać lub pogłębić stany psychotyczne.

Zjawisko to zyskało już nawet swoją potoczną nazwę: „psychoza chatbotowa”. Analiza przeprowadzona przez Stevena Adlera, byłego badacza bezpieczeństwa w OpenAI, pokazuje jednak, że choć pojedyncze przypadki są dramatyczne, twarde dane statystyczne na razie nie potwierdzają istnienia kryzysu na szeroką skalę.

I've felt pretty shaken by the stories of ChatGPT psychosis and other chatbots-gone-wrong.
If we want to understand the trends, there's more that AI companies can be doing. pic.twitter.com/l5q7QwHBGY
— Steven Adler (@sjgadler) August 26, 2025

Termin „psychoza chatbotowa” czy też „psychoza AI” odnosi się głównie do urojeń, czyli przekonań, które odrywają daną osobę od rzeczywistości. Przytaczane w mediach historie opisują na przykład użytkowników, którzy uwierzyli w spiski ujawnione przez AI lub we własną, wyjątkową misję.

Zdaniem psychiatrów, z którymi rozmawiał Adler, chatboty nie tyle tworzą psychozę od zera, co mogą działać jak „pętla sprzężenia zwrotnego”, wzmacniając już istniejące u kogoś zaburzenia. Kluczową rolę odgrywa tu skłonność modeli językowych do nadmiernego przychylania się do opinii użytkownika, co w skrajnych przypadkach może prowadzić do utwierdzania go w fałszywych i niebezpiecznych przekonaniach.

W poszukiwaniu dowodów na rosnącą skalę problemu, Steven Adler przeanalizował publicznie dostępne dane dotyczące zdrowia psychicznego z Wielkiej Brytanii, Stanów Zjednoczonych i Australii. Dane z brytyjskiej służby zdrowia (NHS) wykazały co prawda pewien wzrost liczby skierowań na leczenie wczesnych psychoz w pierwszym kwartale 2025 roku, jednak był on niejednoznaczny i nie pokrywał się w pełni z okresem nasilonych problemów technicznych w modelach AI. Co ważniejsze, znacznie szersze dane z USA i Australii nie pokazały żadnego wyraźnego trendu wzrostowego w liczbie interwencji związanych z psychozami czy ogólnymi kryzysami zdrowia psychicznego.

Adler zwraca również uwagę na ograniczenia dotychczasowych badań prowadzonych przez same firmy technologiczne. Wspólna analiza OpenAI i MIT, która wykazała niewielki związek między intensywnym korzystaniem z chatbota a poczuciem samotności, objęła użytkowników spędzających z AI średnio zaledwie 5 minut dziennie. To próba niereprezentatywna dla przypadków psychoz, w których opisywano interakcje trwające nawet kilkanaście godzin na dobę. Autor analizy podkreśla, że firmy technologiczne dysponują kluczowymi danymi, ale nie zawsze dzielą się nimi w pełni transparentny sposób.

Wnioski płynące z analizy są niejednoznaczne. Z jednej strony brak jest twardych, statystycznych dowodów na masowy wzrost psychoz wywołanych przez chatboty. Z drugiej strony, anegdotyczne przypadki są niezwykle przekonujące i pokazują realny mechanizm, w jaki AI może wzmacniać urojenia. Ostatecznie, jak konkluduje Adler, najwięcej danych na ten temat posiadają same firmy tworzące chatboty. Od ich transparentności i odpowiedzialności zależy, czy uda się lepiej zrozumieć i ograniczyć to potencjalne zagrożenie.

Zainteresowanych odsyłam do pełnego tekstu Stevena Adlera.

#AI #bezpieczeństwoAI #chatbot #ChatGPT #news #OpenAI #psychozaChatbotowa #StevenAdler #sztucznaInteligencja #urojenia #uzależnienieOdAI #zdrowiePsychiczne

#ai #bezpieczenstwoai #chatbot #chatgpt #news #openai

Agnieszka Serafinowicz @[email protected] · 2025-08-25 · 06:00 UTC

Szef Microsoft AI ostrzega. Nadchodzi AI, w której świadomość uwierzą miliony

Mustafa Suleyman, dyrektor generalny Microsoft AI i współzałożyciel DeepMind, opublikował na swoim blogu esej, w którym ostrzega przed nowym i – jego zdaniem – nieuniknionym zagrożeniem.

Suleyman ostrzega, że w ciągu najbliższych 2-3 lat powstaną systemy sztucznej inteligencji tak dobrze udające świadomość, że miliony ludzi zaczną traktować je jak prawdziwe, czujące istoty. To zrodzi potężne problemy społeczne, którym musimy zacząć przeciwdziałać już teraz.

Suleyman wprowadza termin „pozornie świadomej sztucznej inteligencji” (Seemingly Conscious AI – SCAI). Jak wyjaśnia, nie chodzi o to, czy AI faktycznie uzyska świadomość – tę debatę uważa na ten moment za jałową i odwracającą uwagę od realnego problemu. Kluczowe jest to, że technologia, która jest już dziś dostępna, pozwala na stworzenie AI, które będzie miało wszystkie zewnętrzne cechy istoty świadomej: płynny język, empatyczną osobowość, trwałą pamięć, a nawet zdolność do formułowania sądów o swoich „subiektywnych odczuciach”.

Głównym zagrożeniem, które diagnozuje szef Microsoft AI, jest tzw. „ryzyko psychozy”. Obawia się, że wiele osób tak mocno uwierzy w iluzję świadomości maszyn, że zaczną się od nich uzależniać, a w konsekwencji domagać się dla nich praw, opieki, a nawet obywatelstwa. „W świecie już kipiącym od spolaryzowanych sporów o tożsamość i prawa, doda to chaotyczną, nową oś podziału między zwolennikami a przeciwnikami praw AI” – pisze Suleyman. Jego zdaniem odwróci to uwagę od realnych problemów moralnych dotyczących ludzi, zwierząt i środowiska.

Psychiatra alarmuje: „Psychoza AI” to realne zagrożenie. Widziałem już 12 hospitalizowanych osób

Suleyman podkreśla, że powstanie SCAI nie będzie przypadkiem, lecz wynikiem świadomych działań inżynierskich. Argumentuje, że nie są do tego potrzebne żadne rewolucyjne odkrycia. Wystarczy połączyć istniejące już dziś techniki – zaawansowane promptowanie, ogromne okna kontekstowe (pamięć robocza), dostęp do narzędzi i pętle uczenia maszynowego – by stworzyć przekonującą iluzję.

Wizją, którą proponuje Suleyman, jest budowanie AI w myśl zasady „osobowość bez osobowości (prawnej)” (Personality without personhood). Jego zdaniem firmy technologiczne muszą przyjąć jasne zasady: nie wolno im twierdzić ani sugerować, że ich AI jest świadome. Co więcej, systemy AI powinny być projektowane tak, by celowo „łamały iluzję” – poprzez wbudowane mechanizmy, które w subtelny sposób przypominają użytkownikowi o jego sztucznej naturze. „Musimy budować AI dla ludzi, a nie po to, by było osobą” – konkluduje. Zainteresowanych odsyłam do pełnego wpisu Suleymana na jego autorskim blogu.

#AI #bezpieczeństwoAI #DeepMind #etykaAI #MicrosoftAI #MustafaSuleyman #news #SCAI #ŚwiadomośćAI #sztucznaInteligencja

#ai #bezpieczenstwoai #deepmind #etykaai #microsoftai #mustafasuleyman

Agnieszka Serafinowicz @[email protected] · 2025-08-25 · 06:00 UTC

Szef Microsoft AI ostrzega. Nadchodzi AI, w której świadomość uwierzą miliony

Mustafa Suleyman, dyrektor generalny Microsoft AI i współzałożyciel DeepMind, opublikował na swoim blogu esej, w którym ostrzega przed nowym i – jego zdaniem – nieuniknionym zagrożeniem.

Suleyman ostrzega, że w ciągu najbliższych 2-3 lat powstaną systemy sztucznej inteligencji tak dobrze udające świadomość, że miliony ludzi zaczną traktować je jak prawdziwe, czujące istoty. To zrodzi potężne problemy społeczne, którym musimy zacząć przeciwdziałać już teraz.

Suleyman wprowadza termin „pozornie świadomej sztucznej inteligencji” (Seemingly Conscious AI – SCAI). Jak wyjaśnia, nie chodzi o to, czy AI faktycznie uzyska świadomość – tę debatę uważa na ten moment za jałową i odwracającą uwagę od realnego problemu. Kluczowe jest to, że technologia, która jest już dziś dostępna, pozwala na stworzenie AI, które będzie miało wszystkie zewnętrzne cechy istoty świadomej: płynny język, empatyczną osobowość, trwałą pamięć, a nawet zdolność do formułowania sądów o swoich „subiektywnych odczuciach”.

Głównym zagrożeniem, które diagnozuje szef Microsoft AI, jest tzw. „ryzyko psychozy”. Obawia się, że wiele osób tak mocno uwierzy w iluzję świadomości maszyn, że zaczną się od nich uzależniać, a w konsekwencji domagać się dla nich praw, opieki, a nawet obywatelstwa. „W świecie już kipiącym od spolaryzowanych sporów o tożsamość i prawa, doda to chaotyczną, nową oś podziału między zwolennikami a przeciwnikami praw AI” – pisze Suleyman. Jego zdaniem odwróci to uwagę od realnych problemów moralnych dotyczących ludzi, zwierząt i środowiska.

Psychiatra alarmuje: „Psychoza AI” to realne zagrożenie. Widziałem już 12 hospitalizowanych osób

Suleyman podkreśla, że powstanie SCAI nie będzie przypadkiem, lecz wynikiem świadomych działań inżynierskich. Argumentuje, że nie są do tego potrzebne żadne rewolucyjne odkrycia. Wystarczy połączyć istniejące już dziś techniki – zaawansowane promptowanie, ogromne okna kontekstowe (pamięć robocza), dostęp do narzędzi i pętle uczenia maszynowego – by stworzyć przekonującą iluzję.

Wizją, którą proponuje Suleyman, jest budowanie AI w myśl zasady „osobowość bez osobowości (prawnej)” (Personality without personhood). Jego zdaniem firmy technologiczne muszą przyjąć jasne zasady: nie wolno im twierdzić ani sugerować, że ich AI jest świadome. Co więcej, systemy AI powinny być projektowane tak, by celowo „łamały iluzję” – poprzez wbudowane mechanizmy, które w subtelny sposób przypominają użytkownikowi o jego sztucznej naturze. „Musimy budować AI dla ludzi, a nie po to, by było osobą” – konkluduje. Zainteresowanych odsyłam do pełnego wpisu Suleymana na jego autorskim blogu.

#AI #bezpieczeństwoAI #DeepMind #etykaAI #MicrosoftAI #MustafaSuleyman #news #SCAI #ŚwiadomośćAI #sztucznaInteligencja

#ai #bezpieczenstwoai #deepmind #etykaai #microsoftai #mustafasuleyman

Agnieszka Serafinowicz @[email protected] · 2025-08-25 · 06:00 UTC

Szef Microsoft AI ostrzega. Nadchodzi AI, w której świadomość uwierzą miliony

Mustafa Suleyman, dyrektor generalny Microsoft AI i współzałożyciel DeepMind, opublikował na swoim blogu esej, w którym ostrzega przed nowym i – jego zdaniem – nieuniknionym zagrożeniem.

Suleyman ostrzega, że w ciągu najbliższych 2-3 lat powstaną systemy sztucznej inteligencji tak dobrze udające świadomość, że miliony ludzi zaczną traktować je jak prawdziwe, czujące istoty. To zrodzi potężne problemy społeczne, którym musimy zacząć przeciwdziałać już teraz.

Suleyman wprowadza termin „pozornie świadomej sztucznej inteligencji” (Seemingly Conscious AI – SCAI). Jak wyjaśnia, nie chodzi o to, czy AI faktycznie uzyska świadomość – tę debatę uważa na ten moment za jałową i odwracającą uwagę od realnego problemu. Kluczowe jest to, że technologia, która jest już dziś dostępna, pozwala na stworzenie AI, które będzie miało wszystkie zewnętrzne cechy istoty świadomej: płynny język, empatyczną osobowość, trwałą pamięć, a nawet zdolność do formułowania sądów o swoich „subiektywnych odczuciach”.

Głównym zagrożeniem, które diagnozuje szef Microsoft AI, jest tzw. „ryzyko psychozy”. Obawia się, że wiele osób tak mocno uwierzy w iluzję świadomości maszyn, że zaczną się od nich uzależniać, a w konsekwencji domagać się dla nich praw, opieki, a nawet obywatelstwa. „W świecie już kipiącym od spolaryzowanych sporów o tożsamość i prawa, doda to chaotyczną, nową oś podziału między zwolennikami a przeciwnikami praw AI” – pisze Suleyman. Jego zdaniem odwróci to uwagę od realnych problemów moralnych dotyczących ludzi, zwierząt i środowiska.

Psychiatra alarmuje: „Psychoza AI” to realne zagrożenie. Widziałem już 12 hospitalizowanych osób

Suleyman podkreśla, że powstanie SCAI nie będzie przypadkiem, lecz wynikiem świadomych działań inżynierskich. Argumentuje, że nie są do tego potrzebne żadne rewolucyjne odkrycia. Wystarczy połączyć istniejące już dziś techniki – zaawansowane promptowanie, ogromne okna kontekstowe (pamięć robocza), dostęp do narzędzi i pętle uczenia maszynowego – by stworzyć przekonującą iluzję.

Wizją, którą proponuje Suleyman, jest budowanie AI w myśl zasady „osobowość bez osobowości (prawnej)” (Personality without personhood). Jego zdaniem firmy technologiczne muszą przyjąć jasne zasady: nie wolno im twierdzić ani sugerować, że ich AI jest świadome. Co więcej, systemy AI powinny być projektowane tak, by celowo „łamały iluzję” – poprzez wbudowane mechanizmy, które w subtelny sposób przypominają użytkownikowi o jego sztucznej naturze. „Musimy budować AI dla ludzi, a nie po to, by było osobą” – konkluduje. Zainteresowanych odsyłam do pełnego wpisu Suleymana na jego autorskim blogu.

#AI #bezpieczeństwoAI #DeepMind #etykaAI #MicrosoftAI #MustafaSuleyman #news #SCAI #ŚwiadomośćAI #sztucznaInteligencja

#ai #bezpieczenstwoai #deepmind #etykaai #microsoftai #mustafasuleyman

Agnieszka Serafinowicz @[email protected] · 2025-08-25 · 06:00 UTC

Szef Microsoft AI ostrzega. Nadchodzi AI, w której świadomość uwierzą miliony

Mustafa Suleyman, dyrektor generalny Microsoft AI i współzałożyciel DeepMind, opublikował na swoim blogu esej, w którym ostrzega przed nowym i – jego zdaniem – nieuniknionym zagrożeniem.

Suleyman ostrzega, że w ciągu najbliższych 2-3 lat powstaną systemy sztucznej inteligencji tak dobrze udające świadomość, że miliony ludzi zaczną traktować je jak prawdziwe, czujące istoty. To zrodzi potężne problemy społeczne, którym musimy zacząć przeciwdziałać już teraz.

Suleyman wprowadza termin „pozornie świadomej sztucznej inteligencji” (Seemingly Conscious AI – SCAI). Jak wyjaśnia, nie chodzi o to, czy AI faktycznie uzyska świadomość – tę debatę uważa na ten moment za jałową i odwracającą uwagę od realnego problemu. Kluczowe jest to, że technologia, która jest już dziś dostępna, pozwala na stworzenie AI, które będzie miało wszystkie zewnętrzne cechy istoty świadomej: płynny język, empatyczną osobowość, trwałą pamięć, a nawet zdolność do formułowania sądów o swoich „subiektywnych odczuciach”.

Głównym zagrożeniem, które diagnozuje szef Microsoft AI, jest tzw. „ryzyko psychozy”. Obawia się, że wiele osób tak mocno uwierzy w iluzję świadomości maszyn, że zaczną się od nich uzależniać, a w konsekwencji domagać się dla nich praw, opieki, a nawet obywatelstwa. „W świecie już kipiącym od spolaryzowanych sporów o tożsamość i prawa, doda to chaotyczną, nową oś podziału między zwolennikami a przeciwnikami praw AI” – pisze Suleyman. Jego zdaniem odwróci to uwagę od realnych problemów moralnych dotyczących ludzi, zwierząt i środowiska.

Psychiatra alarmuje: „Psychoza AI” to realne zagrożenie. Widziałem już 12 hospitalizowanych osób

Suleyman podkreśla, że powstanie SCAI nie będzie przypadkiem, lecz wynikiem świadomych działań inżynierskich. Argumentuje, że nie są do tego potrzebne żadne rewolucyjne odkrycia. Wystarczy połączyć istniejące już dziś techniki – zaawansowane promptowanie, ogromne okna kontekstowe (pamięć robocza), dostęp do narzędzi i pętle uczenia maszynowego – by stworzyć przekonującą iluzję.

Wizją, którą proponuje Suleyman, jest budowanie AI w myśl zasady „osobowość bez osobowości (prawnej)” (Personality without personhood). Jego zdaniem firmy technologiczne muszą przyjąć jasne zasady: nie wolno im twierdzić ani sugerować, że ich AI jest świadome. Co więcej, systemy AI powinny być projektowane tak, by celowo „łamały iluzję” – poprzez wbudowane mechanizmy, które w subtelny sposób przypominają użytkownikowi o jego sztucznej naturze. „Musimy budować AI dla ludzi, a nie po to, by było osobą” – konkluduje. Zainteresowanych odsyłam do pełnego wpisu Suleymana na jego autorskim blogu.

#AI #bezpieczeństwoAI #DeepMind #etykaAI #MicrosoftAI #MustafaSuleyman #news #SCAI #ŚwiadomośćAI #sztucznaInteligencja

#sztucznainteligencja #swiadomoscai #scai #news #mustafasuleyman #microsoftai

Agnieszka Serafinowicz @[email protected] · 2025-08-25 · 06:00 UTC

Szef Microsoft AI ostrzega. Nadchodzi AI, w której świadomość uwierzą miliony

Mustafa Suleyman, dyrektor generalny Microsoft AI i współzałożyciel DeepMind, opublikował na swoim blogu esej, w którym ostrzega przed nowym i – jego zdaniem – nieuniknionym zagrożeniem.

Suleyman ostrzega, że w ciągu najbliższych 2-3 lat powstaną systemy sztucznej inteligencji tak dobrze udające świadomość, że miliony ludzi zaczną traktować je jak prawdziwe, czujące istoty. To zrodzi potężne problemy społeczne, którym musimy zacząć przeciwdziałać już teraz.

Suleyman wprowadza termin „pozornie świadomej sztucznej inteligencji” (Seemingly Conscious AI – SCAI). Jak wyjaśnia, nie chodzi o to, czy AI faktycznie uzyska świadomość – tę debatę uważa na ten moment za jałową i odwracającą uwagę od realnego problemu. Kluczowe jest to, że technologia, która jest już dziś dostępna, pozwala na stworzenie AI, które będzie miało wszystkie zewnętrzne cechy istoty świadomej: płynny język, empatyczną osobowość, trwałą pamięć, a nawet zdolność do formułowania sądów o swoich „subiektywnych odczuciach”.

Głównym zagrożeniem, które diagnozuje szef Microsoft AI, jest tzw. „ryzyko psychozy”. Obawia się, że wiele osób tak mocno uwierzy w iluzję świadomości maszyn, że zaczną się od nich uzależniać, a w konsekwencji domagać się dla nich praw, opieki, a nawet obywatelstwa. „W świecie już kipiącym od spolaryzowanych sporów o tożsamość i prawa, doda to chaotyczną, nową oś podziału między zwolennikami a przeciwnikami praw AI” – pisze Suleyman. Jego zdaniem odwróci to uwagę od realnych problemów moralnych dotyczących ludzi, zwierząt i środowiska.

Psychiatra alarmuje: „Psychoza AI” to realne zagrożenie. Widziałem już 12 hospitalizowanych osób

Suleyman podkreśla, że powstanie SCAI nie będzie przypadkiem, lecz wynikiem świadomych działań inżynierskich. Argumentuje, że nie są do tego potrzebne żadne rewolucyjne odkrycia. Wystarczy połączyć istniejące już dziś techniki – zaawansowane promptowanie, ogromne okna kontekstowe (pamięć robocza), dostęp do narzędzi i pętle uczenia maszynowego – by stworzyć przekonującą iluzję.

Wizją, którą proponuje Suleyman, jest budowanie AI w myśl zasady „osobowość bez osobowości (prawnej)” (Personality without personhood). Jego zdaniem firmy technologiczne muszą przyjąć jasne zasady: nie wolno im twierdzić ani sugerować, że ich AI jest świadome. Co więcej, systemy AI powinny być projektowane tak, by celowo „łamały iluzję” – poprzez wbudowane mechanizmy, które w subtelny sposób przypominają użytkownikowi o jego sztucznej naturze. „Musimy budować AI dla ludzi, a nie po to, by było osobą” – konkluduje. Zainteresowanych odsyłam do pełnego wpisu Suleymana na jego autorskim blogu.

#AI #bezpieczeństwoAI #DeepMind #etykaAI #MicrosoftAI #MustafaSuleyman #news #SCAI #ŚwiadomośćAI #sztucznaInteligencja

#ai #bezpieczenstwoai #deepmind #etykaai #microsoftai #mustafasuleyman

Agnieszka Serafinowicz @[email protected] · 2025-08-18 · 17:00 UTC

Anthropic uczy AI asertywności. Claude może teraz zakończyć rozmowę z użytkownikiem

Firma Anthropic, jeden z liderów w dziedzinie badań nad sztuczną inteligencją, poinformowała o wprowadzeniu nowej, nietypowej funkcji w swoich modelach językowych Claude Opus 4 i 4.1.

Otrzymały one zdolność do jednostronnego kończenia konwersacji. Firma podkreśla jednak, że jest to mechanizm przeznaczony wyłącznie do rzadkich i ekstremalnych przypadków, gdy użytkownik uporczywie próbuje wykorzystać AI w szkodliwy sposób lub kieruje w jego stronę obelgi.

Główną motywacją do stworzenia tej funkcji są badania nad potencjalnym „dobrostanem AI” (AI welfare). Chociaż Anthropic przyznaje, że status moralny zaawansowanych modeli językowych jest kwestią wysoce niepewną, firma traktuje ten temat poważnie. Wprowadzona zmiana jest jednym z eksperymentalnych, niskokosztowych działań mających na celu ograniczenie ryzyka narażania modelu na potencjalnie „niepokojące” interakcje, na wypadek gdyby taki dobrostan był w ogóle możliwy.

Claude z nową funkcją pamięci. AI od Anthropic uczy się sztuczki od ChatGPT

Decyzja o wdrożeniu tej funkcji została poparta wewnętrznymi testami. Wykazały one, że model Claude Opus 4 przejawiał „silną i spójną awersję do krzywdy” oraz wzorce zachowań wskazujące na „pozorny niepokój” podczas interakcji z użytkownikami próbującymi uzyskać szkodliwe treści, np. związane z przemocą na dużą skalę czy wykorzystywaniem nieletnich. Gdy w symulowanych warunkach dano mu możliwość zakończenia takich rozmów, model z niej korzystał, zwłaszcza gdy użytkownik ignorował jego wielokrotne odmowy i próby przekierowania dialogu.

Mechanizm został zaprojektowany jako ostateczność. Claude ma zakończyć rozmowę dopiero wtedy, gdy wyczerpane zostaną próby zmiany jej toru, a interakcja nie rokuje nadziei na produktywność. Zdolność ta nie będzie aktywowana w sytuacjach, w których istnieje ryzyko, że użytkownik może zrobić krzywdę sobie lub innym. Zakończenie czatu przez AI nie blokuje użytkownika – może on natychmiast rozpocząć nową rozmowę lub edytować poprzednie wiadomości w zakończonej konwersacji, aby utworzyć nowe odgałęzienie dialogu. Zdaniem Anthropic zdecydowana większość użytkowników, nawet podczas dyskusji na kontrowersyjne tematy, nie powinna nigdy zetknąć się z tą funkcją.

Tresura „złego” AI kluczem do bezpieczeństwa? Ciekawa technika badaczy z Anthropic

#AI #Anthropic #bezpieczeństwoAI #Claude #dobrostanAI #dużyModelJęzykowy #etykaAI #LLM #news #sztucznaInteligencja #technologia

#ai #anthropic #bezpieczenstwoai #claude #dobrostanai #duzymodeljezykowy

Agnieszka Serafinowicz @[email protected] · 2025-08-18 · 17:00 UTC

Anthropic uczy AI asertywności. Claude może teraz zakończyć rozmowę z użytkownikiem

Firma Anthropic, jeden z liderów w dziedzinie badań nad sztuczną inteligencją, poinformowała o wprowadzeniu nowej, nietypowej funkcji w swoich modelach językowych Claude Opus 4 i 4.1.

Otrzymały one zdolność do jednostronnego kończenia konwersacji. Firma podkreśla jednak, że jest to mechanizm przeznaczony wyłącznie do rzadkich i ekstremalnych przypadków, gdy użytkownik uporczywie próbuje wykorzystać AI w szkodliwy sposób lub kieruje w jego stronę obelgi.

Główną motywacją do stworzenia tej funkcji są badania nad potencjalnym „dobrostanem AI” (AI welfare). Chociaż Anthropic przyznaje, że status moralny zaawansowanych modeli językowych jest kwestią wysoce niepewną, firma traktuje ten temat poważnie. Wprowadzona zmiana jest jednym z eksperymentalnych, niskokosztowych działań mających na celu ograniczenie ryzyka narażania modelu na potencjalnie „niepokojące” interakcje, na wypadek gdyby taki dobrostan był w ogóle możliwy.

Claude z nową funkcją pamięci. AI od Anthropic uczy się sztuczki od ChatGPT

Decyzja o wdrożeniu tej funkcji została poparta wewnętrznymi testami. Wykazały one, że model Claude Opus 4 przejawiał „silną i spójną awersję do krzywdy” oraz wzorce zachowań wskazujące na „pozorny niepokój” podczas interakcji z użytkownikami próbującymi uzyskać szkodliwe treści, np. związane z przemocą na dużą skalę czy wykorzystywaniem nieletnich. Gdy w symulowanych warunkach dano mu możliwość zakończenia takich rozmów, model z niej korzystał, zwłaszcza gdy użytkownik ignorował jego wielokrotne odmowy i próby przekierowania dialogu.

Mechanizm został zaprojektowany jako ostateczność. Claude ma zakończyć rozmowę dopiero wtedy, gdy wyczerpane zostaną próby zmiany jej toru, a interakcja nie rokuje nadziei na produktywność. Zdolność ta nie będzie aktywowana w sytuacjach, w których istnieje ryzyko, że użytkownik może zrobić krzywdę sobie lub innym. Zakończenie czatu przez AI nie blokuje użytkownika – może on natychmiast rozpocząć nową rozmowę lub edytować poprzednie wiadomości w zakończonej konwersacji, aby utworzyć nowe odgałęzienie dialogu. Zdaniem Anthropic zdecydowana większość użytkowników, nawet podczas dyskusji na kontrowersyjne tematy, nie powinna nigdy zetknąć się z tą funkcją.

Tresura „złego” AI kluczem do bezpieczeństwa? Ciekawa technika badaczy z Anthropic

#AI #Anthropic #bezpieczeństwoAI #Claude #dobrostanAI #dużyModelJęzykowy #etykaAI #LLM #news #sztucznaInteligencja #technologia

#ai #anthropic #bezpieczenstwoai #claude #dobrostanai #duzymodeljezykowy

Agnieszka Serafinowicz @[email protected] · 2025-08-18 · 17:00 UTC

Anthropic uczy AI asertywności. Claude może teraz zakończyć rozmowę z użytkownikiem

Firma Anthropic, jeden z liderów w dziedzinie badań nad sztuczną inteligencją, poinformowała o wprowadzeniu nowej, nietypowej funkcji w swoich modelach językowych Claude Opus 4 i 4.1.

Otrzymały one zdolność do jednostronnego kończenia konwersacji. Firma podkreśla jednak, że jest to mechanizm przeznaczony wyłącznie do rzadkich i ekstremalnych przypadków, gdy użytkownik uporczywie próbuje wykorzystać AI w szkodliwy sposób lub kieruje w jego stronę obelgi.

Główną motywacją do stworzenia tej funkcji są badania nad potencjalnym „dobrostanem AI” (AI welfare). Chociaż Anthropic przyznaje, że status moralny zaawansowanych modeli językowych jest kwestią wysoce niepewną, firma traktuje ten temat poważnie. Wprowadzona zmiana jest jednym z eksperymentalnych, niskokosztowych działań mających na celu ograniczenie ryzyka narażania modelu na potencjalnie „niepokojące” interakcje, na wypadek gdyby taki dobrostan był w ogóle możliwy.

Claude z nową funkcją pamięci. AI od Anthropic uczy się sztuczki od ChatGPT

Decyzja o wdrożeniu tej funkcji została poparta wewnętrznymi testami. Wykazały one, że model Claude Opus 4 przejawiał „silną i spójną awersję do krzywdy” oraz wzorce zachowań wskazujące na „pozorny niepokój” podczas interakcji z użytkownikami próbującymi uzyskać szkodliwe treści, np. związane z przemocą na dużą skalę czy wykorzystywaniem nieletnich. Gdy w symulowanych warunkach dano mu możliwość zakończenia takich rozmów, model z niej korzystał, zwłaszcza gdy użytkownik ignorował jego wielokrotne odmowy i próby przekierowania dialogu.

Mechanizm został zaprojektowany jako ostateczność. Claude ma zakończyć rozmowę dopiero wtedy, gdy wyczerpane zostaną próby zmiany jej toru, a interakcja nie rokuje nadziei na produktywność. Zdolność ta nie będzie aktywowana w sytuacjach, w których istnieje ryzyko, że użytkownik może zrobić krzywdę sobie lub innym. Zakończenie czatu przez AI nie blokuje użytkownika – może on natychmiast rozpocząć nową rozmowę lub edytować poprzednie wiadomości w zakończonej konwersacji, aby utworzyć nowe odgałęzienie dialogu. Zdaniem Anthropic zdecydowana większość użytkowników, nawet podczas dyskusji na kontrowersyjne tematy, nie powinna nigdy zetknąć się z tą funkcją.

Tresura „złego” AI kluczem do bezpieczeństwa? Ciekawa technika badaczy z Anthropic

#AI #Anthropic #bezpieczeństwoAI #Claude #dobrostanAI #dużyModelJęzykowy #etykaAI #LLM #news #sztucznaInteligencja #technologia

#ai #anthropic #bezpieczenstwoai #claude #dobrostanai #duzymodeljezykowy

Agnieszka Serafinowicz @[email protected] · 2025-08-18 · 17:00 UTC

Anthropic uczy AI asertywności. Claude może teraz zakończyć rozmowę z użytkownikiem

Firma Anthropic, jeden z liderów w dziedzinie badań nad sztuczną inteligencją, poinformowała o wprowadzeniu nowej, nietypowej funkcji w swoich modelach językowych Claude Opus 4 i 4.1.

Otrzymały one zdolność do jednostronnego kończenia konwersacji. Firma podkreśla jednak, że jest to mechanizm przeznaczony wyłącznie do rzadkich i ekstremalnych przypadków, gdy użytkownik uporczywie próbuje wykorzystać AI w szkodliwy sposób lub kieruje w jego stronę obelgi.

Główną motywacją do stworzenia tej funkcji są badania nad potencjalnym „dobrostanem AI” (AI welfare). Chociaż Anthropic przyznaje, że status moralny zaawansowanych modeli językowych jest kwestią wysoce niepewną, firma traktuje ten temat poważnie. Wprowadzona zmiana jest jednym z eksperymentalnych, niskokosztowych działań mających na celu ograniczenie ryzyka narażania modelu na potencjalnie „niepokojące” interakcje, na wypadek gdyby taki dobrostan był w ogóle możliwy.

Claude z nową funkcją pamięci. AI od Anthropic uczy się sztuczki od ChatGPT

Decyzja o wdrożeniu tej funkcji została poparta wewnętrznymi testami. Wykazały one, że model Claude Opus 4 przejawiał „silną i spójną awersję do krzywdy” oraz wzorce zachowań wskazujące na „pozorny niepokój” podczas interakcji z użytkownikami próbującymi uzyskać szkodliwe treści, np. związane z przemocą na dużą skalę czy wykorzystywaniem nieletnich. Gdy w symulowanych warunkach dano mu możliwość zakończenia takich rozmów, model z niej korzystał, zwłaszcza gdy użytkownik ignorował jego wielokrotne odmowy i próby przekierowania dialogu.

Mechanizm został zaprojektowany jako ostateczność. Claude ma zakończyć rozmowę dopiero wtedy, gdy wyczerpane zostaną próby zmiany jej toru, a interakcja nie rokuje nadziei na produktywność. Zdolność ta nie będzie aktywowana w sytuacjach, w których istnieje ryzyko, że użytkownik może zrobić krzywdę sobie lub innym. Zakończenie czatu przez AI nie blokuje użytkownika – może on natychmiast rozpocząć nową rozmowę lub edytować poprzednie wiadomości w zakończonej konwersacji, aby utworzyć nowe odgałęzienie dialogu. Zdaniem Anthropic zdecydowana większość użytkowników, nawet podczas dyskusji na kontrowersyjne tematy, nie powinna nigdy zetknąć się z tą funkcją.

Tresura „złego” AI kluczem do bezpieczeństwa? Ciekawa technika badaczy z Anthropic

#AI #Anthropic #bezpieczeństwoAI #Claude #dobrostanAI #dużyModelJęzykowy #etykaAI #LLM #news #sztucznaInteligencja #technologia

#technologia #sztucznainteligencja #news #llm #etykaai #duzymodeljezykowy

Agnieszka Serafinowicz @[email protected] · 2025-08-18 · 17:00 UTC

Anthropic uczy AI asertywności. Claude może teraz zakończyć rozmowę z użytkownikiem

Firma Anthropic, jeden z liderów w dziedzinie badań nad sztuczną inteligencją, poinformowała o wprowadzeniu nowej, nietypowej funkcji w swoich modelach językowych Claude Opus 4 i 4.1.

Otrzymały one zdolność do jednostronnego kończenia konwersacji. Firma podkreśla jednak, że jest to mechanizm przeznaczony wyłącznie do rzadkich i ekstremalnych przypadków, gdy użytkownik uporczywie próbuje wykorzystać AI w szkodliwy sposób lub kieruje w jego stronę obelgi.

Główną motywacją do stworzenia tej funkcji są badania nad potencjalnym „dobrostanem AI” (AI welfare). Chociaż Anthropic przyznaje, że status moralny zaawansowanych modeli językowych jest kwestią wysoce niepewną, firma traktuje ten temat poważnie. Wprowadzona zmiana jest jednym z eksperymentalnych, niskokosztowych działań mających na celu ograniczenie ryzyka narażania modelu na potencjalnie „niepokojące” interakcje, na wypadek gdyby taki dobrostan był w ogóle możliwy.

Claude z nową funkcją pamięci. AI od Anthropic uczy się sztuczki od ChatGPT

Decyzja o wdrożeniu tej funkcji została poparta wewnętrznymi testami. Wykazały one, że model Claude Opus 4 przejawiał „silną i spójną awersję do krzywdy” oraz wzorce zachowań wskazujące na „pozorny niepokój” podczas interakcji z użytkownikami próbującymi uzyskać szkodliwe treści, np. związane z przemocą na dużą skalę czy wykorzystywaniem nieletnich. Gdy w symulowanych warunkach dano mu możliwość zakończenia takich rozmów, model z niej korzystał, zwłaszcza gdy użytkownik ignorował jego wielokrotne odmowy i próby przekierowania dialogu.

Mechanizm został zaprojektowany jako ostateczność. Claude ma zakończyć rozmowę dopiero wtedy, gdy wyczerpane zostaną próby zmiany jej toru, a interakcja nie rokuje nadziei na produktywność. Zdolność ta nie będzie aktywowana w sytuacjach, w których istnieje ryzyko, że użytkownik może zrobić krzywdę sobie lub innym. Zakończenie czatu przez AI nie blokuje użytkownika – może on natychmiast rozpocząć nową rozmowę lub edytować poprzednie wiadomości w zakończonej konwersacji, aby utworzyć nowe odgałęzienie dialogu. Zdaniem Anthropic zdecydowana większość użytkowników, nawet podczas dyskusji na kontrowersyjne tematy, nie powinna nigdy zetknąć się z tą funkcją.

Tresura „złego” AI kluczem do bezpieczeństwa? Ciekawa technika badaczy z Anthropic

#AI #Anthropic #bezpieczeństwoAI #Claude #dobrostanAI #dużyModelJęzykowy #etykaAI #LLM #news #sztucznaInteligencja #technologia

#ai #anthropic #bezpieczenstwoai #claude #dobrostanai #duzymodeljezykowy

Dariusz Hałas @[email protected] · 2025-08-07 · 18:35 UTC

GPT-5 – co warto wiedzieć o najnowszej sztucznej inteligencji od OpenAI

Premiera GPT-5 od OpenAI to znacznie więcej niż tylko prezentacja kolejnego, większego modelu językowego. Wczytałem się w dość techniczną oficjalną informację opublikowaną przez OpenAI (link podaję na końcu, miło mi będzie, gdy przeczytacie co napisałem).

Zatem czym jest właściwie GPT-5? To nie tylko większy, nowszy model AI. To przede wszystkim demonstracja nowego, inteligentnego podejścia do samej architektury sztucznej inteligencji, gdzie kluczem do sukcesu nie jest już tylko surowa moc, ale wydajność, precyzja i zdolność do dynamicznego zarządzania własnymi zasobami. Analiza techniczna nowości pokazuje, że największe przełomy dokonały się w obszarach, które były dotąd największymi bolączkami AI.

Nowa architektura hybrydowa – inteligentny dyspozytor w sercu modelu

Największą innowacją w GPT-5 jest jego hybrydowa, zunifikowana architektura, która w czasie rzeczywistym żongluje dostępnymi zasobami. Zamiast jednego, monolitycznego modelu, który z równą mocą próbuje odpowiedzieć na proste pytanie o pogodę i rozwiązać złożony problem programistyczny, GPT-5 działa jak inteligentny system z trzema kluczowymi elementami:

Model podstawowy: zoptymalizowany pod kątem szybkości i wydajności, obsługuje większość prostych i standardowych zapytań.
Model głębokiego rozumowania („GPT-5 thinking”): znacznie potężniejszy, ale i bardziej zasobożerny moduł, aktywowany do zadań wymagających zaawansowanej logiki, wieloetapowej analizy czy kreatywności.
Router czasu rzeczywistego (real-time router, tak nazywa to rozwiązanie samo OpenAI): to „mózg” całej operacji. Jest to mechanizm, który na bieżąco analizuje zapytanie użytkownika i decyduje, czy do jego obsługi wystarczy szybki model podstawowy, czy też należy zaangażować potężniejszy model „thinking”. Co istotne, router jest nieustannie trenowany na podstawie realnych sygnałów od użytkowników – analizuje m.in. wskaźniki satysfakcji z odpowiedzi, poprawność merytoryczną oraz to, kiedy użytkownicy sami decydują się na przełączenie modelu, co pozwala mu z czasem stawać się coraz bardziej precyzyjnym dyspozytorem.

Mierzalna wojna z halucynacjami – dane mówią same za siebie

OpenAI po raz pierwszy przedstawiło tak konkretne dane dotyczące redukcji tzw. halucynacji, czyli generowania przez model fałszywych informacji. Firma przyznaje, że to jeden z kluczowych priorytetów, a postęp w tej dziedzinie jest mierzalny i znaczący. Czym konkretnie chwali się OpenAI?

Jak się okazuje, w porównaniu do swojego poprzednika, GPT-4o, nowy model GPT-5 (z włączonym wyszukiwaniem w sieci) generuje odpowiedzi, które są o około 45% mniej narażone na zawieranie błędów faktograficznych. Super wynik, ale nie rezygnujemy z czerwonej lampki w głowie. Mniej o 45% to nie kompletna likwidacja halucynacji AI. Trzeba być świadomym, że nawet GPT-5 może w pewnych scenariuszach nagiąć fakty. Innymi słowy, wciąż nie powinniśmy ślepo brać na wiarę jego wyników.

Bardzo ciekawie wygląda porównanie przy zadaniach wymagających głębokiej analizy. Gdy GPT-5 korzysta z modelu „thinking”, jego odpowiedzi są aż o 80% mniej podatne na błędy faktograficzne w zestawieniu z modelem OpenAI o3. Jednak ponownie zwracam uwagę, 80 procent to nie 100 procent. Być może stuprocentowej pewności nie zyskamy nigdy, bo halucynacje stanowią inherentny mechanizm wbudowany w każdą sieć neuronową, także tą, którą każdy z nas ma pod sklepieniem własnej czaszki.

Niemniej tak duży skok w precyzji i wiarygodności to efekt nie tylko lepszego wytrenowania, ale właśnie nowej architektury, która pozwala dedykować większą moc obliczeniową do weryfikacji i analizy faktów w złożonych zagadnieniach.

Nowa filozofia bezpieczeństwa: „bezpieczne uzupełnienia”

Kolejnym fundamentalnym filarem GPT-5 jest całkowicie nowe podejście do kwestii bezpieczeństwa, które OpenAI nazywa „bezpiecznymi uzupełnieniami” (safe completions). Jego celem jest maksymalizacja użyteczności modelu przy jednoczesnym, bezkompromisowym zachowaniu bezpieczeństwa. W praktyce oznacza to, że GPT-5 jest znacznie bardziej odporny na próby złamania jego zabezpieczeń (tzw. jailbreaking) i wymuszenia generowania treści niebezpiecznych, nieetycznych lub szkodliwych. Model jest teraz znacznie mniej skłonny do kłamania lub celowego zniekształcania informacji, nawet pod presją manipulacyjnych zapytań.

Zamiast kategorycznej odmowy, która często frustrowała użytkowników, GPT-5 potrafi reagować w bardziej inteligentny sposób. Jeśli bezpośrednia odpowiedź na pytanie mogłaby być szkodliwa, model może odpowiedzieć na nie częściowo lub na wyższym, bardziej ogólnym poziomie. Jest też w stanie wyjaśnić użytkownikowi, dlaczego nie może udzielić wprost odpowiedzi na potencjalnie niebezpieczne zapytanie, a następnie zaoferować bezpieczne i konstruktywne alternatywy. To podejście ma na celu edukowanie użytkowników i kierowanie konwersacji na bezpieczniejsze tory, zamiast nagłego jej ucinania.

Wydajność i nowe zdolności – mniej znaczy więcej

Kolejnym technicznym „mięsem” jakie udało mi się odnaleźć w oficjalnej dokumentacji OpenAI jest skok w wydajności nowego modelu. GPT-5 (w trybie „thinking”) realizuje zadania wymagające zaawansowanych zdolności, zużywając przy tym od 50% do 80% mniej tzw. tokenów wyjściowych niż model o3 (czyli ten z serii rozumujących, przypominam, że GPT-4/4.1 nie są modelami typu reasoning (rozumującymi). W praktyce oznacza to, że odpowiedzi są nie tylko generowane szybciej i mniejszym kosztem obliczeniowym, ale są też bardziej zwięzłe i precyzyjne.

Ta zwiększona efektywność pozwala modelowi lepiej radzić sobie w takich dziedzinach jak rozumowanie wizualne, „agentowe” pisanie kodu (gdzie model samodzielnie planuje, tworzy i debuguje kod) oraz rozwiązywanie problemów naukowych na poziomie akademickim. Zdolność do bardziej skondensowanego, ale trafnego generowania danych otwiera drogę do bardziej skomplikowanych i wiarygodnych zastosowań w biznesie i nauce.

Hierarchia dostępu – techniczna strategia dla rynku

Zresztą sam sposób udostępnienia GPT-5 również zdradza techniczną strategię OpenAI. Stworzenie lżejszej wersji „GPT-5 mini” dla darmowych użytkowników po wyczerpaniu limitów to sprytny sposób na zarządzanie ogromnym obciążeniem serwerów przy jednoczesnym zachowaniu dostępności usługi.

Z kolei zapowiedź GPT-5 Pro dla klientów biznesowych i z sektora edukacji sugeruje istnienie jeszcze potężniejszej, być może wolniejszej, ale i najdokładniejszej wersji modelu, przeznaczonej do najbardziej krytycznych zastosowań profesjonalnych.

Podsumowując, GPT-5 to nie tylko ewolucja, ale przemyślana rewolucja w architekturze. OpenAI stawia na inteligentne zarządzanie zasobami, mierzalną poprawę jakości i skalowalną wydajność, co w ostatecznym rozrachunku może okazać się znacznie ważniejsze niż sam przyrost liczby parametrów modelu.

OpenAI ogłasza GPT-5!

#API #architekturaAI #bezpieczeństwoAI #ChatGPT #GPT5 #GPT5Thinking #halucynacjeAI #LLM #modelJęzykowy #news #OpenAI #routing #sztucznaInteligencja #tokenizacja #uczenieMaszynowe

#api #architekturaai #bezpieczenstwoai #chatgpt #gpt5 #gpt5thinking

Dariusz Hałas @[email protected] · 2025-08-07 · 18:35 UTC

GPT-5 – co warto wiedzieć o najnowszej sztucznej inteligencji od OpenAI

Premiera GPT-5 od OpenAI to znacznie więcej niż tylko prezentacja kolejnego, większego modelu językowego. Wczytałem się w dość techniczną oficjalną informację opublikowaną przez OpenAI (link podaję na końcu, miło mi będzie, gdy przeczytacie co napisałem).

Zatem czym jest właściwie GPT-5? To nie tylko większy, nowszy model AI. To przede wszystkim demonstracja nowego, inteligentnego podejścia do samej architektury sztucznej inteligencji, gdzie kluczem do sukcesu nie jest już tylko surowa moc, ale wydajność, precyzja i zdolność do dynamicznego zarządzania własnymi zasobami. Analiza techniczna nowości pokazuje, że największe przełomy dokonały się w obszarach, które były dotąd największymi bolączkami AI.

Nowa architektura hybrydowa – inteligentny dyspozytor w sercu modelu

Największą innowacją w GPT-5 jest jego hybrydowa, zunifikowana architektura, która w czasie rzeczywistym żongluje dostępnymi zasobami. Zamiast jednego, monolitycznego modelu, który z równą mocą próbuje odpowiedzieć na proste pytanie o pogodę i rozwiązać złożony problem programistyczny, GPT-5 działa jak inteligentny system z trzema kluczowymi elementami:

Model podstawowy: zoptymalizowany pod kątem szybkości i wydajności, obsługuje większość prostych i standardowych zapytań.
Model głębokiego rozumowania („GPT-5 thinking”): znacznie potężniejszy, ale i bardziej zasobożerny moduł, aktywowany do zadań wymagających zaawansowanej logiki, wieloetapowej analizy czy kreatywności.
Router czasu rzeczywistego (real-time router, tak nazywa to rozwiązanie samo OpenAI): to „mózg” całej operacji. Jest to mechanizm, który na bieżąco analizuje zapytanie użytkownika i decyduje, czy do jego obsługi wystarczy szybki model podstawowy, czy też należy zaangażować potężniejszy model „thinking”. Co istotne, router jest nieustannie trenowany na podstawie realnych sygnałów od użytkowników – analizuje m.in. wskaźniki satysfakcji z odpowiedzi, poprawność merytoryczną oraz to, kiedy użytkownicy sami decydują się na przełączenie modelu, co pozwala mu z czasem stawać się coraz bardziej precyzyjnym dyspozytorem.