#приватность_данных — Public Fediverse posts
Live and recent posts from across the Fediverse tagged #приватность_данных, aggregated by home.social.
-
Toyota Woven City — самый дорогой датасет в истории корпоративных исследований
Если у вас завалялись лишние десять миллиардов долларов и есть желание построить город будущего — что ж, Toyota вас опередила. В сентябре 2025 года крупнейший автопроизводитель мира официально открыл у подножия горы Фудзи свой полигон мобильности Woven City. На месте старого завода площадью семьдесят гектаров появились стильные дома из дерева и бетона, подземная инфраструктура водородной энергетики, тоннели для роботов-курьеров. Архитектором выступил Бьярке Ингельс — тот самый, кто проектировал штаб-квартиру Google. Энергия поступает от водородных топливных элементов и солнечных панелей. Дороги разделены на три типа, и они физически не пересекаются. Жителей пока около сотни. Их называют Weavers — «ткачами», вероятно, в память о том, что Toyota когда-то начинала с ткацких станков. Город закрыт для посторонних: широкая публика попадет сюда, по плану компании, только в следующем финансовом году, и то по записи. Звучит как очередная корпоративная утопия в духе Кремниевой долины. Но это не так. Это самый аккуратно спроектированный эксперимент по сбору данных о людях, который когда-либо ставила частная компания. Давайте разберемся, что к чему.
https://habr.com/ru/companies/ru_mts/articles/1037218/
#Toyota #Woven_City #умный_город #корпоративный_город #автономный_транспорт #AI_Vision_Engine #приватность_данных #роботы_для_пожилых #Япония #Sidewalk_Labs
-
Дифференциальная приватность в ML
Привет, Хабр! Сегодня поговорим в коротком формате о защите данных при обучении моделей, а именно в процессе обучения. Никому не понравится, если ваша нейросеть вдруг выдаст чужие паспортные данные или медицинские записи, правда? А ведь модели машинного обучения иногда склонны запоминать кусочки обучающего набора. Бывали случчаи, где из языковой модели вытаскивали строки с номерами телефонов и email тех людей, чьи данные были в тренировочном датасете. Стоит ли нам вообще кормить модель конфиденциальной информацией , если она потом болтает лишнее? К счастью, есть крутая техника — дифференциальная приватность . Она позволяет обучать ML-модели на реальных данных, но с гарантией, что никакой отдельный пользователь не будет опознан моделью. Разобраться в DP
https://habr.com/ru/companies/otus/articles/970382/
#opacus #дифференциальная_приватность #ml #машинное_обучение #приватность_данных #обучение_нейросетей #DPSGD #PyTorch #конфиденциальные_данные
-
Open Notebook — приватная альтернатива Google Notebook LM с поддержкой 16+ AI-провайдеров
Недавно наткнулся на интересный open-source проект под названием Open Notebook. Это такая альтернатива Google Notebook LM, только с открытым кодом и кучей дополнительных возможностей. Сам пока не тестировал, но штука выглядит настолько интересно, что решил рассказать. Сейчас AI-инструменты используют все подряд, и вопросы приватности становятся всё острее. Open Notebook как раз предлагает решение — полный контроль над данными, поддержка разных AI-моделей и возможность развернуть всё у себя на сервере. Что это вообще такое Open Notebook — это система для организации знаний с поддержкой AI. Можно загружать исследовательские материалы, анализировать информацию и получать инсайты из разных источников. Главное отличие от облачных решений — можно развернуть на своём сервере, и никто кроме вас не будет иметь доступа к данным. По функционалу это полноценная замена Google Notebook LM, но с открытым исходным кодом и гораздо большими возможностями настройки. Работает с PDF, видео, аудио, веб-страницами и документами Office. Что умеет Возможностей там прилично: Поддержка 16+ AI-провайдеров. Можно подключить модели от OpenAI, Anthropic, Google, Ollama, LM Studio, Mistral, DeepSeek, xAI, Groq, Perplexity и других. То есть выбираешь то, что подходит по цене и качеству для конкретной задачи. Генерация подкастов. Система создаёт многоголосые подкасты на основе загруженных материалов — от 1 до 4 спикеров. У Google Notebook LM, кстати, максимум два спикера. Умный поиск. Есть полнотекстовый и векторный поиск по всему контенту. Удобно, когда накопилось много материалов.
https://habr.com/ru/articles/962090/
#искусственный_интеллект #ии #ai #open_source #Open_Notebook #Notebook_LM #elfhosted #приватность_данных #исследовательские_инструменты #управление_знаниями
-
Как научить нейросеть запоминать вас: технология персонального контекста
Если вы, как и я, регулярно общаетесь с нейросетями, то наверняка сталкивались с ситуацией, когда приходится раз за разом объяснять ИИ одни и те же вещи: кто вы, чем занимаетесь, какие у вас предпочтения и цели. Каждый новый чат — это знакомство с чистого листа. Как создать цифровую память для нейросети
https://habr.com/ru/articles/892136/
#chatgpt #искусственный_интеллект #llm #персонализация #нейросети #персональный_ассистент #промптинжиниринг #AI_память #Приватность_данных
-
Перейди по ссылке, и я узнаю твой номер
В цифровую эпоху уже никто не удивляется, когда ему звонят с незнакомых номеров с рекламой. Мало ли какие соглашения о персональных данных мы подписываем и на каких сайтах оставляем свой номер. Но сейчас на рынке информационных услуг всё большую популярность набирают сервисы, занимающиеся деанонимизацией пользователей при одном лишь открытии сайта . Причём всё это преподносится как абсолютно легальный сервис для бизнеса, с соблюдением закона о персональных данных. Но что если вы не хотите оставлять свой номер на сайте, который просто открыли? Поговорим на примере одного из таких сервисов - dmp.one. Важно: автор рекомендует открывать этот адрес во вкладке инкогнито с включённым uBlock Origin с кастомными правилами (о них ниже), иначе есть риск попадания вашего телефона в базу.
https://habr.com/ru/articles/819595/
#приватность_данных #персональные_данные #блокировщики_рекламы #cookieбаннеры #cookies #безопасность_данных #этичность #анонимность #фингерпринтинг