home.social

#voice-control — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #voice-control, aggregated by home.social.

fetched live
  1. Apple Intelligence trafia do narzędzi dostępności – wózki inwalidzkie sterowane oczami

    W przeddzień WWDC 2026 (jak co roku) Apple ogłosiło coroczny pakiet nowości dostępnościowych — tym razem z wyraźnym akcentem na Apple Intelligence. Jak podaje centrum prasowe Apple, większość ogłoszonych funkcji trafi na urządzenia jeszcze w tym roku. To między innymi: naturalna mowa w Voice Control, szczegółowe opisy w VoiceOver i Magnifier, automatyczne napisy dla wideo oraz sterowanie wózkiem inwalidzkim oczami przez Vision Pro.

    VoiceOver i Magnifier z Apple Intelligence

    Dla użytkowników niewidomych i słabowidzących największą zmianą jest integracja Apple Intelligence z VoiceOver i Magnifier. Nowa funkcja Image Explorer w VoiceOver będzie generować znacznie bardziej szczegółowe opisy obrazów — zdjęć, skanów rachunków czy dokumentów — niż dotychczas. Ulepszony Live Recognition pozwoli nacisnąć przycisk Action i zapytać głosowo o to, co widzi kamera, a następnie zadawać pytania uzupełniające w naturalnym języku. Magnifier otrzyma identyczne możliwości w swoim interfejsie wysokiego kontrastu, do tego z obsługą poleceń głosowych takich jak „przybliż” czy „włącz latarkę”.

    Voice Control mówi to, co widzisz

    Duża zmiana dotyczy też Voice Control — funkcji nawigowania iPhone’em i iPadem wyłącznie głosem. Do tej pory użytkownicy musieli znać dokładne etykiety przycisków lub numery elementów ekranu. Apple Intelligence zmienia to, wprowadzając tryb „say what you see”: zamiast wywoływać element po numerze, można powiedzieć po prostu „naciśnij fioletowy folder” lub „naciśnij przewodnik o najlepszych restauracjach” – to jest absolutna rewolucja na rynku urządzeń wspierających osoby z niepełnosprawnościami, a przecież tutaj mówimy o całym ekosystemie urządzeń.

    Niestety, funkcja ta dostępna będzie na razie tylko po angielsku w USA, Kanadzie, Wielkiej Brytanii i Australii.

    Automatyczne napisy dla każdego wideo

    Nowość, która wykracza poza grupę użytkowników z niepełnosprawnościami — automatycznie generowane napisy dla filmów bez istniejących napisów. System będzie działał lokalnie, na urządzeniu (bez wysyłania audio do chmury), i automatycznie wyświetlał transkrypcję mówionego dialogu w filmach nagranych iPhone’em, otrzymanych od znajomych lub streamowanych online. Funkcja obejmie iPhone’a, iPada, Maca, Apple TV i Apple Vision Pro.

    Ponownie, na starcie dostępna będzie w języku angielskim w USA i Kanadzie.

    Vision Pro steruje wózkiem inwalidzkim

    Najbardziej spektakularną nowością jest sterowanie elektrycznym wózkiem inwalidzkim oczami — przez komputer przestrzenny Apple Vision Pro. System precyzyjnego śledzenia wzroku w headset pozwala użytkownikom, dla których tradycyjny joystick nie jest opcją, poruszać się za pomocą alternatywnych systemów napędowych. Funkcja startuje ze wsparciem dla systemów Tolt i LUCI w USA, przez Bluetooth i przewodowo. Apple zapowiedziało rozszerzanie kompatybilności z kolejnymi systemami wózków. Jak komentuje Jason Snell z Six Colors, to jeden z tych momentów, które przypominają, dlaczego Apple Intelligence — wbrew powszechnemu postrzeganiu — jest czymś więcej niż generowaniem grafik i streszczaniem e-maili.

    Pozostałe nowości

    W pakiecie znalazły się też: Vehicle Motion Cues dla visionOS (dla osób podatnych na chorobę lokomocyjną) – sam korzystam z tej funkcji na iPhonie i iPadzie non stop, gdy się przemieszczam, obsługa gestów twarzy w Vision Pro, Name Recognition w ponad 50 językach (powiadomienie dla niesłyszących, gdy ktoś wymówi ich imię), Larger Text dla tvOS, nowe API do dodawania tłumacza języka migowego do rozmów FaceTime oraz obsługa kontrolera Sony Access jako pada do gier na iOS, iPadOS i macOS.

    Hikawa Grip & Stand w nowych kolorach

    Przy okazji Apple udostępniło globalnie w Apple Store nową wersję Hikawa Grip & Stand for iPhone — adaptacyjnego uchwytu MagSafe zaprojektowanego przez Bailey Hikawa we współpracy z osobami z niepełnosprawnościami ograniczającymi chwyt i mobilność. Akcesoria dostępne są teraz w trzech nowych kolorach, po raz pierwszy na całym świecie, we współpracy z PopSockets.

    Produkt nie jest dostępny w Polsce.

    Więcej o przydatnych funkcjach dostępności posłuchasz w jednym z odcinków mojego podcastu.

    Dwie funkcje iOS 27, które przydadzą się każdemu

    Omówione wyżej ogłoszenie Apple dotyczące nowych funkcji dostępności – bezpośrednio rzutuje na to, co zobaczymy w iOS 27 (i pozostałych systemach z tej rodziny) — choć oficjalnie skierowane do użytkowników z niepełnosprawnościami — w praktyce mogą okazać się przydatne dla niemal każdego.

    Napisy do wszystkiego

    Generated Subtitles to automatyczne generowanie napisów dla filmów, które nie mają własnych napisów — i to dosłownie wszędzie w systemie. Jak zauważa 9to5Mac, funkcja obejmie filmy w mediach społecznościowych, klipy w aplikacji Zdjęcia, wideo w Wiadomościach i każde inne treści wideo odtwarzane na iPhonie, iPadzie, Macu, Apple TV i Vision Pro. Transkrypcja generowana będzie lokalnie, na urządzeniu, bez wysyłania audio do chmury. Wygląd napisów będzie konfigurowalny w ustawieniach lub bezpośrednio w odtwarzaczu.

    Scenariusz, w którym ta funkcja naprawdę błyszczy, jest trywialny: publiczne miejsce, wyciszony telefon, film bez napisów. Do tej pory byłeś zdany na łaskę twórcy lub platformy. Od iOS 27 napisy będą zawsze — niezależnie od źródła wideo. Polscy użytkownicy będą musieli poczekać na rozszerzenie wsparcia językowego.

    Voice Control i zapowiedź agentycznej Siri

    Drugi wątek jest głębszy. Ulepszony Voice Control w iOS 27 pozwoli nawigować telefonem, mówiąc po prostu to, co się widzi na ekranie — „naciśnij fioletowy folder”, „otwórz przewodnik o restauracjach” — zamiast wywoływać elementy po numerach czy dokładnych etykietach. Jak zauważa 9to5Mac, Mark Gurman potwierdził na X, że te same agentyczne możliwości leżące u podstaw nowego Voice Control są wbudowane w Siri w iOS 27.

    To ważny sygnał. W 2024 roku Apple zapowiedziało, że Siri zyska zdolność do wykonywania akcji w aplikacjach i między nimi oraz świadomość tego, co dzieje się na ekranie — obie funkcje zostały opóźnione i nigdy nie trafiły do użytkowników. Teraz Apple pokazało przy okazji funkcji dostępności, że ta architektura faktycznie istnieje i działa. Jeśli iPhone potrafi rozpoznać elementy interfejsu dowolnej aplikacji i zareagować na polecenie w naturalnym języku dla Voice Control, ta sama infrastruktura może działać agentycznie — wykonując wieloetapowe zadania autonomicznie. Jest niemal pewne, że ta funkcja zostanie wykorzystana w okularach Apple Glasses.

    8 czerwca na WWDC dowiemy się, na ile ta obietnica jest tym razem realna.

    Apple rozsyła zaproszenia na WWDC 2026

    #AccessibilityReader #agentycznaAI #AppleIntelligence #dostępność #GeneratedSubtitles #HikawaGrip #iOS27 #Magnifier #MagSafe #MarkGurman #NameRecognition #napisy #OS27 #Siri #SonyAccess #tvOS #VisionPro #VoiceControl #VoiceOver #watchOS #wózekInwalidzki #WWDC2026
  2. #UnplugBigTech Tipp 5: Open-Source-Sprachassistent

    Verabschiede dich von Alexa und anderen Sprachassistenten, die deine Gespräche mithören und auswerten. Nutze stattdessen eine datenschutzfreundliche Alternative wie OpenVoiceOS, ein Open-Source-Sprachassistent, der von einer aktiven Community weiterentwickelt wird und auf einem RaspberryPi läuft. So behältst du die Kontrolle über deine Daten.

    openvoiceos.org/

    #Alexa #OpenVoiceOS #Sprachassistent #VoiceControl #SpeechRecognition #datenschutz #privacy

  3. #UnplugBigTech Tipp 5: Open-Source-Sprachassistent

    Verabschiede dich von Alexa und anderen Sprachassistenten, die deine Gespräche mithören und auswerten. Nutze stattdessen eine datenschutzfreundliche Alternative wie OpenVoiceOS, ein Open-Source-Sprachassistent, der von einer aktiven Community weiterentwickelt wird und auf einem RaspberryPi läuft. So behältst du die Kontrolle über deine Daten.

    openvoiceos.org/

    #Alexa #OpenVoiceOS #Sprachassistent #VoiceControl #SpeechRecognition #datenschutz #privacy

  4. GOOGLE'S VOICE ASSISTANT: A CACOPHONY OF COMMANDS

    Google Assistant commands for smart home, music, and productivity are listed. See how to control lights, play music, set timers, and more.

    #GoogleAssistant, #SmartHome, #VoiceControl, #TechTips, #GoogleHome

    newsletter.tf/google-assistant

  5. @9to5Mac

    that's an absolute nightmare scenario that will likely result in the same outcome as the rude individuals watching videos or talking to someone on speaker, in public. 🤦 🤮

    #VoiceAssistant #VoiceControl #Apple #Siri #Amazon #Alexa

  6. @9to5Mac

    that's an absolute nightmare scenario that will likely result in the same outcome as the rude individuals watching videos or talking to someone on speaker, in public. 🤦 🤮

    #VoiceAssistant #VoiceControl #Apple #Siri #Amazon #Alexa

  7. clawdbot reads the synced notes and does whatever i tell it. "turn this into a tweet thread" becomes a literal voice command with extra steps

    #VoiceControl #Automation

  8. clawdbot reads the synced notes and does whatever i tell it. "turn this into a tweet thread" becomes a literal voice command with extra steps

    #VoiceControl #Automation

  9. Ứng dụng máy ảnh điều khiển bằng giọng nói cho iPhone - chỉ cần nói "cheese" để chụp ảnh. Không cần chạm, chụp ảnh dễ dàng khi tay bận (nấu ăn, chụp nhóm,...). Hỗ trợ lệnh: photo, video, selfie, flash, zoom,... Xử lý giọng nói trực tiếp trên thiết bị, không gửi server. Miễn phí 10 lần chụp, nâng cấp Pro 2,99$ trọn đời. #VoiceControl #CameraApp #iOS #SideProject #CôngNghệ #iPhone #AppViệt

    reddit.com/r/SideProject/comme

  10. Linux desktop voice control has a gap. Talon costs money. Other tools are X11-only or cloud-dependent.

    So I built EasySpeak.

    youtube.com/watch?v=dl5m2Zo1oIE

    github.com/ctsdownloads/easysp

    - Free and open source (GPL-3.0)
    - Fully local — no cloud, no accounts
    - Wayland-native
    - "Hey Jarvis, open downloads"

    Built for RSI, accessibility, or anyone who wants to talk to their computer.

  11. Linux desktop voice control has a gap. Talon costs money. Other tools are X11-only or cloud-dependent.

    So I built EasySpeak.

    youtube.com/watch?v=dl5m2Zo1oIE

    github.com/ctsdownloads/easysp

    - Free and open source (GPL-3.0)
    - Fully local — no cloud, no accounts
    - Wayland-native
    - "Hey Jarvis, open downloads"

    Built for RSI, accessibility, or anyone who wants to talk to their computer.

    #Linux #OpenSource #Accessibility #VoiceControl #GNOME #Wayland #a11y

  12. Voice läuft jetzt via Home Assistant. Das Timing perfekt zum ersten Digital Independence Day.

    Aber: Zwischen Freiheit & Komfort klafft eine Lücke: Kein Vergleich zur glattgebügelten Plug&Play-Erfahrung von Alexa, Google, Siri & Co - dafür aber halt #DigitaleSouveränität.

    War aber echt Arbeit.

    🔗 Mehr: di.day/
    🧠 Voice: home-assistant.io/voice-pe/
    🏠 HA: home-assistant.io

    #DigitalIndependenceDay #HomeAssistant #VoiceControl #SmartHomet #AlexaWarGestern #OpenSource #DIDay #DID

  13. Voice läuft jetzt via Home Assistant. Das Timing perfekt zum ersten Digital Independence Day.

    Aber: Zwischen Freiheit & Komfort klafft eine Lücke: Kein Vergleich zur glattgebügelten Plug&Play-Erfahrung von Alexa, Google, Siri & Co - dafür aber halt #DigitaleSouveränität.

    War aber echt Arbeit.

    🔗 Mehr: di.day/
    🧠 Voice: home-assistant.io/voice-pe/
    🏠 HA: home-assistant.io

    #DigitalIndependenceDay #HomeAssistant #VoiceControl #SmartHomet #AlexaWarGestern #OpenSource #DIDay #DID

  14. 🔊 Small size. Big sound. Smarter living.
    Meet the Echo Dot (5th Generation)—designed to fill your room with richer audio while Alexa helps you manage your day effortlessly.

    🎵 Music
    🏠 Smart home control
    ⏰ Alarms & routines
    🎁 Perfect gift

    Minimal design. Maximum convenience.

    check the product here: mackreyblog.com/amazon-echo-de

    #echodot5thgen #AlexaBuiltIn #SmartHomeDevices #VoiceControl #techgadgets #smartliving #giftideas

  15. Milestone: 314 active voice rules! 🎙️

    SL5 Aura is our 100% offline, privacy-first voice control system. Instead of sending audio to the cloud, it processes commands locally using a hierarchical rule engine. Fast, secure, and customizable.

    Building a transparent tool for architects, not just another smart speaker. 🔧

    #OfflineAI #Privacy #VoiceControl #Linux #UnPlugTrump #SL5aura

  16. Fact-Friday: Viele Smart Home Geräte können auch mit Sprachassistenten integriert werden. So steuerst du dein Zuhause einfach mit Sprache. Ein interaktives Erlebnis! #SmartHome #VoiceControl

  17. Fact-Friday: Viele Smart Home Geräte können auch mit Sprachassistenten integriert werden. So steuerst du dein Zuhause einfach mit Sprache. Ein interaktives Erlebnis! #SmartHome #VoiceControl

  18. Speechify just leveled up its Chrome extension! 🎙️
    Now you can voice type and even chat with a voice assistant directly in your browser. Another step towards hands-free computing or just more things listening in?

    What are your thoughts on integrated voice assistants?
    #AI #TechNews #VoiceControl #Productivity

    Read more: techcrunch.com/2025/11/25/spee

  19. Get ready to ditch the keyboard! Qualcomm is betting big on agentic AI, suggesting we'll soon be conversing with our devices instead of typing. They say it'll improve our lives... if we just believe.

    What's the wildest thing you'd trust an AI agent to do for you?

    #AIagents #Qualcomm #VoiceControl #TechInnovation #FutureOfTech

    Read more: cnet.com/tech/mobile/agentic-a

  20. I would like to thank #Roku for adding a "voice control" button to every one of their remotes for me to push instead of the "play" button I'm aiming for.

    #voicecontrol #voicecontrolAI #baddesign #design #enshittification #ai

  21. I would like to thank #Roku for adding a "voice control" button to every one of their remotes for me to push instead of the "play" button I'm aiming for.

    #voicecontrol #voicecontrolAI #baddesign #design #enshittification #ai

  22. Der Home Assistant Voice Preview ist inzwischen auf meinem Tisch angekommen und hat ein halb festes Plätzchen! 😁 Läuft auch ehrlicherweise aktuell alles gut. Besser als ich es erwartet habe! Aber wie zur Hölle kann ich die Farben einer Beleuchtung umstellen?! 🤯 Ich bekomme nur ein „Weiß isch nüsch“ - als hätte das Teil noch nie die Farbe Weiß gesehen 😭 #SmartHome #HomeAutomation #VoiceControl #TechTroubles

  23. Der Home Assistant Voice Preview ist inzwischen auf meinem Tisch angekommen und hat ein halb festes Plätzchen! 😁 Läuft auch ehrlicherweise aktuell alles gut. Besser als ich es erwartet habe! Aber wie zur Hölle kann ich die Farben einer Beleuchtung umstellen?! 🤯 Ich bekomme nur ein „Weiß isch nüsch“ - als hätte das Teil noch nie die Farbe Weiß gesehen 😭 #SmartHome #HomeAutomation #VoiceControl #TechTroubles

  24. Exciting news from VoIPster Com President A Mitchell has launched the Linux Dictation Project, an open-source voice dictation and command interface for Linux. Designed with accessibility in mind, it features offline transcription using Whisper, voice-controlled text entry, and application control. Perfect for users with physical disabilities, it supports modifier keys and systemd integration. #TechForGood #Linux #OpenSource #Accessibility #VoiceControl linuxtoday.com/blog/voipster-c

  25. Fact-Friday: Wusstest du, dass die Integration von Sprachassistenten in dein Smart Home dir nicht nur Komfort, sondern auch Energie sparen kann? Lass die Technik für dich arbeiten! #SmartHome #Energieeffizienz #VoiceControl

  26. The Glass Art Society Star Trek convention for glass nerds is heating up here in Arlington along with the weather!

    I installed a forbidden doodle at Low Doubt bar as part of the Third Thursday Art Walk- so I shall have to get over to Fort Worth tomorrow.

    Clifton Crofford made this "Seeds of A New Season" rainbow. That I enjoyed a long with a bunch of other art.

    Raj Singh made a really neat torch that tunes different flame settings with your voice.

    And the High Volume Oxygen customer map is a decent map of glass studios (that use oxygen concentrators). The usual city suspects abound :)

    The forbidden doodle I installed generates its own wifi network. It was installed by the restaurant owner in a Texas y manner- hey no holes in the wall :)

    #texas #glass #glassartsociety #glass #nerds #glassnerd #art #sculpture #seeds #rainbow #map #torch #voicecontrol #neon #dfw #fortworth #dallas