home.social

#аптайм — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #аптайм, aggregated by home.social.

  1. Зачем я решил научить Statuser следить за DNS — и что из этого вышло

    Мы привыкли считать, что если сервер доступен и SSL в порядке — значит, всё под контролем. Но иногда сбой происходит раньше , ещё до того, как запрос дошёл до сервера. Меня зовут Михаил Шпаков, я создаю и развиваю сервис мониторинга Statuser. Недавно я общался с руководителем IT-отдела одной компании, которая использует Statuser для мониторинга своих сервисов. Он поделился интересным кейсом: несколько часов подряд у них перестала отправляться почта с корпоративного домена . Сайт работал, сервер был доступен, SSL-сертификат в порядке — всё зелёное, а письма не уходят. Проблема выглядела случайной: часть писем доставлялась, часть возвращалась с ошибкой, а из-за этого срывались заказы и возникали прямые убытки. Когда их команда начала разбираться, выяснилось, что недавно один из сотрудников сменил почтового провайдера и добавил новые MX-записи в DNS, но старые при этом не удалил. В результате часть писем уходила на старый сервер, который уже не принимал почту, а часть — на новый. Снаружи всё выглядело исправно, но на деле домен был «раздвоен» между двумя почтовыми системами . После этого разговора я понял, что в Statuser не хватает отдельного типа мониторинга — контроля DNS-записей . HTTP, SSL и Ping могут быть зелёными, но если в DNS остались старые MX, сервис уже фактически неисправен . Так в Statuser появился новый тип мониторинга — проверки DNS , который помогает замечать изменения, подмены и ошибки в зонах ещё до того, как они превращаются в простои и убытки.

    habr.com/ru/companies/timeweb/

    #statuser #мониторинг #аптайм #инфраструктура #инцидент #уведомления #dns #домен #ssl #timeweb_статьи

  2. Что такое SLA, и сколько стоит девятка в аптайме

    Простой или не простой, вот в чём вопрос… Звучит философски, но в жизни сисадмина философии мало — куда важнее чёткие показатели. Например, сколько минут (или секунд) сервис может быть недоступен, прежде чем начнутся убытки и паника. Ответ на этот вопрос обычно можно найти в SLA, в котором все хотят увидеть побольше заветных «девяток» аптайма. Но что именно стоит «99,99%», откуда вообще берутся эти «девятки» и зачем SLA нужно ИТ-отделу? Давайте разбираться. Читать

    habr.com/ru/companies/ruvds/ar

    #хостинг #uptime #sla #slo #9999 #аптайм #сервер #системное_администрирование #простой #ruvds_статьи

  3. [Перевод] Мониторинг аптайма в 2025: шокирующая математика, которую хостинг-компании не хотят, чтобы вы знали

    99.9% аптайма. Три невинные цифры, которые хостинг‑компании размещают по всем своим маркетинговым материалам как знаки отличия. Звучит впечатляюще, не так ли? Почти идеальная надежность. Ваш сайт работает стабильно 999 минут из каждой 1000. Но вот что они вам не говорят: 99.9% аптайма означает, что ваш сайт недоступен 8 часов 46 минут каждый год. Если хотите проверить математику, таблицы доступности конвертируют 99.9% в ~8ч 46м/год, а 99.99% в ~52.6м. В 30-дневном месяце 99.9% допускает около 43м 49с простоя, в то время как 99.99% около 4м 23с. Это целый рабочий день. Исчез. Клиенты видят страницы ошибок, продажи испаряются, email‑сообщения возвращаются обратно. Пока вы платите премиальные цены за «корпоративную надежность». И становится хуже. Разница в 0.1% между 99.9% и 99.8% аптайма? Она представляет удвоение времени простоя с 8.77 часов до 17.53 часов в год. Тем не менее хостинг‑компании ценят эти тарифы так, будто разница незначительна. Ап... что??

    habr.com/ru/articles/950706/

    #хостинг #мониторинг #sla #простой_сайта #надежность_хостинга #серверы #доступность #вебхостинг #аптайм

  4. Цифровая энтропия: почему ваш сервер с аптаймом в 1000 дней — это ходячий мертвец, и как с этим жить

    Привет, коллеги! Хочу рассказать одну историю. Был у нас в стойке один сервер. Назовем его «Феникс». Работал как часы, аптайм — 986 дней. Мы им гордились, ставили в пример новичкам, мол, вот как надо настраивать железо и софт. А потом пришло время планового техобслуживания в дата-центре. Простое выключение-включение. «Феникс» больше не взлетел. RAID-контроллер решил, что с него хватит, а заодно прихватил с собой пару дисков из массива. Вот тогда я впервые по-настояшему задумался о том, что цифровой мир подчиняется тем же жестоким законам, что и физический. В теории, код и данные — это нечто вечное. Биты не ржавеют, скрипты не изнашиваются. Но на практике любая сложная система со временем деградирует. Это не просто отказ железа ; это медленный, неумолимый «постепенный скат в беспорядок» , который затрагивает всё: софт, конфигурации, данные. Это явление, которое я для себя называю цифровой энтропией , — наш с вами постоянный и невидимый враг. Наша работа — не просто строить системы, а вести непрерывную войну с их неизбежным распадом. Эта статья — путешествие по самым темным уголкам цифровой энтропии. Мы заглянем в глаза её самым жутким проявлениям, поделимся байками из серверной и вооружимся как тактическими командами для экстренных случаев, так и стратегическими концепциями, которые помогут держать хаос в узде.

    habr.com/ru/articles/950002/

    #аптайм #системное_администрирование #энтропия #утечка_памяти #зомби #logrotate #перезагрузка

  5. Цифровая энтропия: почему ваш сервер с аптаймом в 1000 дней — это ходячий мертвец, и как с этим жить

    Привет, коллеги! Хочу рассказать одну историю. Был у нас в стойке один сервер. Назовем его «Феникс». Работал как часы, аптайм — 986 дней. Мы им гордились, ставили в пример новичкам, мол, вот как надо настраивать железо и софт. А потом пришло время планового техобслуживания в дата-центре. Простое выключение-включение. «Феникс» больше не взлетел. RAID-контроллер решил, что с него хватит, а заодно прихватил с собой пару дисков из массива. Вот тогда я впервые по-настояшему задумался о том, что цифровой мир подчиняется тем же жестоким законам, что и физический. В теории, код и данные — это нечто вечное. Биты не ржавеют, скрипты не изнашиваются. Но на практике любая сложная система со временем деградирует. Это не просто отказ железа ; это медленный, неумолимый «постепенный скат в беспорядок» , который затрагивает всё: софт, конфигурации, данные. Это явление, которое я для себя называю цифровой энтропией , — наш с вами постоянный и невидимый враг. Наша работа — не просто строить системы, а вести непрерывную войну с их неизбежным распадом. Эта статья — путешествие по самым темным уголкам цифровой энтропии. Мы заглянем в глаза её самым жутким проявлениям, поделимся байками из серверной и вооружимся как тактическими командами для экстренных случаев, так и стратегическими концепциями, которые помогут держать хаос в узде.

    habr.com/ru/articles/950002/

    #аптайм #системное_администрирование #энтропия #утечка_памяти #зомби #logrotate #перезагрузка

  6. Цифровая энтропия: почему ваш сервер с аптаймом в 1000 дней — это ходячий мертвец, и как с этим жить

    Привет, коллеги! Хочу рассказать одну историю. Был у нас в стойке один сервер. Назовем его «Феникс». Работал как часы, аптайм — 986 дней. Мы им гордились, ставили в пример новичкам, мол, вот как надо настраивать железо и софт. А потом пришло время планового техобслуживания в дата-центре. Простое выключение-включение. «Феникс» больше не взлетел. RAID-контроллер решил, что с него хватит, а заодно прихватил с собой пару дисков из массива. Вот тогда я впервые по-настояшему задумался о том, что цифровой мир подчиняется тем же жестоким законам, что и физический. В теории, код и данные — это нечто вечное. Биты не ржавеют, скрипты не изнашиваются. Но на практике любая сложная система со временем деградирует. Это не просто отказ железа ; это медленный, неумолимый «постепенный скат в беспорядок» , который затрагивает всё: софт, конфигурации, данные. Это явление, которое я для себя называю цифровой энтропией , — наш с вами постоянный и невидимый враг. Наша работа — не просто строить системы, а вести непрерывную войну с их неизбежным распадом. Эта статья — путешествие по самым темным уголкам цифровой энтропии. Мы заглянем в глаза её самым жутким проявлениям, поделимся байками из серверной и вооружимся как тактическими командами для экстренных случаев, так и стратегическими концепциями, которые помогут держать хаос в узде.

    habr.com/ru/articles/950002/

    #аптайм #системное_администрирование #энтропия #утечка_памяти #зомби #logrotate #перезагрузка

  7. Цифровая энтропия: почему ваш сервер с аптаймом в 1000 дней — это ходячий мертвец, и как с этим жить

    Привет, коллеги! Хочу рассказать одну историю. Был у нас в стойке один сервер. Назовем его «Феникс». Работал как часы, аптайм — 986 дней. Мы им гордились, ставили в пример новичкам, мол, вот как надо настраивать железо и софт. А потом пришло время планового техобслуживания в дата-центре. Простое выключение-включение. «Феникс» больше не взлетел. RAID-контроллер решил, что с него хватит, а заодно прихватил с собой пару дисков из массива. Вот тогда я впервые по-настояшему задумался о том, что цифровой мир подчиняется тем же жестоким законам, что и физический. В теории, код и данные — это нечто вечное. Биты не ржавеют, скрипты не изнашиваются. Но на практике любая сложная система со временем деградирует. Это не просто отказ железа ; это медленный, неумолимый «постепенный скат в беспорядок» , который затрагивает всё: софт, конфигурации, данные. Это явление, которое я для себя называю цифровой энтропией , — наш с вами постоянный и невидимый враг. Наша работа — не просто строить системы, а вести непрерывную войну с их неизбежным распадом. Эта статья — путешествие по самым темным уголкам цифровой энтропии. Мы заглянем в глаза её самым жутким проявлениям, поделимся байками из серверной и вооружимся как тактическими командами для экстренных случаев, так и стратегическими концепциями, которые помогут держать хаос в узде.

    habr.com/ru/articles/950002/

    #аптайм #системное_администрирование #энтропия #утечка_памяти #зомби #logrotate #перезагрузка

  8. Почему мониторинг — это ещё не всё. История появления статус пейджей в Statuser

    Привет! Меня зовут Михаил Шпаков, я разрабатываю Statuser — платформу для мониторинга доступности сайтов, приложений и серверов. Делаю всё один, по вечерам, без команды. В этой статье я расскажу, как появилась функциональность, которая была в планах с самого начала — публичные страницы статуса . Эта идея зрела давно, и запросы от первых клиентов только ускорили её появление. Объясню, как всё устроено внутри, с какими техническими решениями пришлось столкнуться и почему статус-пейджи — это логичное продолжение любого хорошего мониторинга .

    habr.com/ru/companies/timeweb/

    #мониторинг #статусстраницы #доступность #инциденты #аптайм #уведомления #кастомные_домены #DevOps #Statuser #timeweb_статьи

  9. Почему мониторинг — это ещё не всё. История появления статус пейджей в Statuser

    Привет! Меня зовут Михаил Шпаков, я разрабатываю Statuser — платформу для мониторинга доступности сайтов, приложений и серверов. Делаю всё один, по вечерам, без команды. В этой статье я расскажу, как появилась функциональность, которая была в планах с самого начала — публичные страницы статуса . Эта идея зрела давно, и запросы от первых клиентов только ускорили её появление. Объясню, как всё устроено внутри, с какими техническими решениями пришлось столкнуться и почему статус-пейджи — это логичное продолжение любого хорошего мониторинга .

    habr.com/ru/companies/timeweb/

    #мониторинг #статусстраницы #доступность #инциденты #аптайм #уведомления #кастомные_домены #DevOps #Statuser #timeweb_статьи

  10. Почему мониторинг — это ещё не всё. История появления статус пейджей в Statuser

    Привет! Меня зовут Михаил Шпаков, я разрабатываю Statuser — платформу для мониторинга доступности сайтов, приложений и серверов. Делаю всё один, по вечерам, без команды. В этой статье я расскажу, как появилась функциональность, которая была в планах с самого начала — публичные страницы статуса . Эта идея зрела давно, и запросы от первых клиентов только ускорили её появление. Объясню, как всё устроено внутри, с какими техническими решениями пришлось столкнуться и почему статус-пейджи — это логичное продолжение любого хорошего мониторинга .

    habr.com/ru/companies/timeweb/

    #мониторинг #статусстраницы #доступность #инциденты #аптайм #уведомления #кастомные_домены #DevOps #Statuser #timeweb_статьи

  11. Почему мониторинг — это ещё не всё. История появления статус пейджей в Statuser

    Привет! Меня зовут Михаил Шпаков, я разрабатываю Statuser — платформу для мониторинга доступности сайтов, приложений и серверов. Делаю всё один, по вечерам, без команды. В этой статье я расскажу, как появилась функциональность, которая была в планах с самого начала — публичные страницы статуса . Эта идея зрела давно, и запросы от первых клиентов только ускорили её появление. Объясню, как всё устроено внутри, с какими техническими решениями пришлось столкнуться и почему статус-пейджи — это логичное продолжение любого хорошего мониторинга .

    habr.com/ru/companies/timeweb/

    #мониторинг #статусстраницы #доступность #инциденты #аптайм #уведомления #кастомные_домены #DevOps #Statuser #timeweb_статьи

  12. Аптайм-страничка Kener.ing — выглядит современно и приятно, работает с выключенным JS (ибо Svelte), много способов пинга и уведомлений.

    Но нода жрёт, блин, 143 мегабайта оперативной памяти!

    Хоть свой #аптайм пиши.
    Я хотел, но опять гуглить пошёл, обрадовался хорошим вариантам.

    Есть, кстати, Vigil на расте, только я чё-т прикола не понял юзать нативный openssl вместо rustls и тащить шаблонизатор tera вместо лёгкого askama или sailfish.

  13. Почему «99.9% аптайма» – это не то, что вы думаете

    Многие думают, что 99.9% аптайма – это почти идеальная работа сервиса. На деле эта цифра означает, что ваш сервис может лежать до 8 часов 45 минут в год. Посмотреть расчеты

    habr.com/ru/articles/914846/

    #sla #uptime #тестирование #аптайм