home.social

#приватность_данных — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #приватность_данных, aggregated by home.social.

  1. Toyota Woven City — самый дорогой датасет в истории корпоративных исследований

    Если у вас завалялись лишние десять миллиардов долларов и есть желание построить город будущего — что ж, Toyota вас опередила. В сентябре 2025 года крупнейший автопроизводитель мира официально открыл у подножия горы Фудзи свой полигон мобильности Woven City. На месте старого завода площадью семьдесят гектаров появились стильные дома из дерева и бетона, подземная инфраструктура водородной энергетики, тоннели для роботов-курьеров. Архитектором выступил Бьярке Ингельс — тот самый, кто проектировал штаб-квартиру Google. Энергия поступает от водородных топливных элементов и солнечных панелей. Дороги разделены на три типа, и они физически не пересекаются. Жителей пока около сотни. Их называют Weavers — «ткачами», вероятно, в память о том, что Toyota когда-то начинала с ткацких станков. Город закрыт для посторонних: широкая публика попадет сюда, по плану компании, только в следующем финансовом году, и то по записи. Звучит как очередная корпоративная утопия в духе Кремниевой долины. Но это не так. Это самый аккуратно спроектированный эксперимент по сбору данных о людях, который когда-либо ставила частная компания. Давайте разберемся, что к чему.

    habr.com/ru/companies/ru_mts/a

    #Toyota #Woven_City #умный_город #корпоративный_город #автономный_транспорт #AI_Vision_Engine #приватность_данных #роботы_для_пожилых #Япония #Sidewalk_Labs

  2. Дифференциальная приватность в ML

    Привет, Хабр! Сегодня поговорим в коротком формате о защите данных при обучении моделей, а именно в процессе обучения. Никому не понравится, если ваша нейросеть вдруг выдаст чужие паспортные данные или медицинские записи, правда? А ведь модели машинного обучения иногда склонны запоминать кусочки обучающего набора. Бывали случчаи, где из языковой модели вытаскивали строки с номерами телефонов и email тех людей, чьи данные были в тренировочном датасете. Стоит ли нам вообще кормить модель конфиденциальной информацией , если она потом болтает лишнее? К счастью, есть крутая техника — дифференциальная приватность . Она позволяет обучать ML-модели на реальных данных, но с гарантией, что никакой отдельный пользователь не будет опознан моделью. Разобраться в DP

    habr.com/ru/companies/otus/art

    #opacus #дифференциальная_приватность #ml #машинное_обучение #приватность_данных #обучение_нейросетей #DPSGD #PyTorch #конфиденциальные_данные

  3. Open Notebook — приватная альтернатива Google Notebook LM с поддержкой 16+ AI-провайдеров

    Недавно наткнулся на интересный open-source проект под названием Open Notebook. Это такая альтернатива Google Notebook LM, только с открытым кодом и кучей дополнительных возможностей. Сам пока не тестировал, но штука выглядит настолько интересно, что решил рассказать. Сейчас AI-инструменты используют все подряд, и вопросы приватности становятся всё острее. Open Notebook как раз предлагает решение — полный контроль над данными, поддержка разных AI-моделей и возможность развернуть всё у себя на сервере. Что это вообще такое Open Notebook — это система для организации знаний с поддержкой AI. Можно загружать исследовательские материалы, анализировать информацию и получать инсайты из разных источников. Главное отличие от облачных решений — можно развернуть на своём сервере, и никто кроме вас не будет иметь доступа к данным. По функционалу это полноценная замена Google Notebook LM, но с открытым исходным кодом и гораздо большими возможностями настройки. Работает с PDF, видео, аудио, веб-страницами и документами Office. Что умеет Возможностей там прилично: Поддержка 16+ AI-провайдеров. Можно подключить модели от OpenAI, Anthropic, Google, Ollama, LM Studio, Mistral, DeepSeek, xAI, Groq, Perplexity и других. То есть выбираешь то, что подходит по цене и качеству для конкретной задачи. Генерация подкастов. Система создаёт многоголосые подкасты на основе загруженных материалов — от 1 до 4 спикеров. У Google Notebook LM, кстати, максимум два спикера. Умный поиск. Есть полнотекстовый и векторный поиск по всему контенту. Удобно, когда накопилось много материалов.

    habr.com/ru/articles/962090/

    #искусственный_интеллект #ии #ai #open_source #Open_Notebook #Notebook_LM #elfhosted #приватность_данных #исследовательские_инструменты #управление_знаниями

  4. Как научить нейросеть запоминать вас: технология персонального контекста

    Если вы, как и я, регулярно общаетесь с нейросетями, то наверняка сталкивались с ситуацией, когда приходится раз за разом объяснять ИИ одни и те же вещи: кто вы, чем занимаетесь, какие у вас предпочтения и цели. Каждый новый чат — это знакомство с чистого листа. Как создать цифровую память для нейросети

    habr.com/ru/articles/892136/

    #chatgpt #искусственный_интеллект #llm #персонализация #нейросети #персональный_ассистент #промптинжиниринг #AI_память #Приватность_данных

  5. Перейди по ссылке, и я узнаю твой номер

    В цифровую эпоху уже никто не удивляется, когда ему звонят с незнакомых номеров с рекламой. Мало ли какие соглашения о персональных данных мы подписываем и на каких сайтах оставляем свой номер. Но сейчас на рынке информационных услуг всё большую популярность набирают сервисы, занимающиеся деанонимизацией пользователей при одном лишь открытии сайта . Причём всё это преподносится как абсолютно легальный сервис для бизнеса, с соблюдением закона о персональных данных. Но что если вы не хотите оставлять свой номер на сайте, который просто открыли? Поговорим на примере одного из таких сервисов - dmp.one. Важно: автор рекомендует открывать этот адрес во вкладке инкогнито с включённым uBlock Origin с кастомными правилами (о них ниже), иначе есть риск попадания вашего телефона в базу.

    habr.com/ru/articles/819595/

    #приватность_данных #персональные_данные #блокировщики_рекламы #cookieбаннеры #cookies #безопасность_данных #этичность #анонимность #фингерпринтинг