#надёжность — Public Fediverse posts on home.social

Habr @[email protected] · 2026-04-14 · 08:32 UTC

Кто мониторит монитор? Рекурсивная задача, у которой нет чистого решения

У вас есть Grafana. Она показывает графики с Prometheus. Prometheus скрейпит метрики с ваших сервисов. Если сервис упал — вы видите красный на дашборде. Если Prometheus упал — вы не видите ничего. Дашборд замирает на последних известных значениях. Если не знать, что Prometheus лежит, можно час смотреть на «зелёный» дашборд, который на самом деле показывает данные часовой давности. Это не гипотетика. Я видел это дважды.

https://habr.com/ru/articles/1023188/

#мониторинг #observability #devops #надёжность #sre #архитектура #отказоустойчивость

#отказоустойчивость #архитектура #sre #надёжность #devops #observability

Habr @[email protected] · 2026-04-14 · 08:32 UTC

Кто мониторит монитор? Рекурсивная задача, у которой нет чистого решения

У вас есть Grafana. Она показывает графики с Prometheus. Prometheus скрейпит метрики с ваших сервисов. Если сервис упал — вы видите красный на дашборде. Если Prometheus упал — вы не видите ничего. Дашборд замирает на последних известных значениях. Если не знать, что Prometheus лежит, можно час смотреть на «зелёный» дашборд, который на самом деле показывает данные часовой давности. Это не гипотетика. Я видел это дважды.

https://habr.com/ru/articles/1023188/

#мониторинг #observability #devops #надёжность #sre #архитектура #отказоустойчивость

#отказоустойчивость #архитектура #sre #надёжность #devops #observability

Habr @[email protected] · 2026-04-14 · 08:32 UTC

Кто мониторит монитор? Рекурсивная задача, у которой нет чистого решения

У вас есть Grafana. Она показывает графики с Prometheus. Prometheus скрейпит метрики с ваших сервисов. Если сервис упал — вы видите красный на дашборде. Если Prometheus упал — вы не видите ничего. Дашборд замирает на последних известных значениях. Если не знать, что Prometheus лежит, можно час смотреть на «зелёный» дашборд, который на самом деле показывает данные часовой давности. Это не гипотетика. Я видел это дважды.

https://habr.com/ru/articles/1023188/

#мониторинг #observability #devops #надёжность #sre #архитектура #отказоустойчивость

#отказоустойчивость #архитектура #sre #надёжность #devops #observability

Habr @[email protected] · 2026-04-14 · 08:32 UTC

Кто мониторит монитор? Рекурсивная задача, у которой нет чистого решения

У вас есть Grafana. Она показывает графики с Prometheus. Prometheus скрейпит метрики с ваших сервисов. Если сервис упал — вы видите красный на дашборде. Если Prometheus упал — вы не видите ничего. Дашборд замирает на последних известных значениях. Если не знать, что Prometheus лежит, можно час смотреть на «зелёный» дашборд, который на самом деле показывает данные часовой давности. Это не гипотетика. Я видел это дважды.

https://habr.com/ru/articles/1023188/

#мониторинг #observability #devops #надёжность #sre #архитектура #отказоустойчивость

#мониторинг #observability #devops #надёжность #sre #архитектура

Habr @[email protected] · 2026-03-18 · 07:12 UTC

Эпические баги: как один Break положил телефонную сеть по всему США в 1990 г

В подразделении, где я работаю, есть традиция - новичку при онбординге вручается ссылка на Wiki с легендарными багами, приведшими к заметным последствиям. Недавно мне пришла в голову идея сделать такую же страницу, но уже со ссылками на Хабр, потому что на русском о багах пишут с бОльшим огоньком. Но, увы, оказалось, что каскадному падению серверов AT&T 15 января 1990 года внимание как-то не уделено. А ведь история получилась, прямо-таки эпическая. Итак, 15 января 1990 года из-за одной строчки кода телефонная сеть AT&T получила 9 часов даунтайма, 70 миллионов несовершенных звонков, а общий убыток насчитали в $60 миллионов еще не инфляционных долларов. И нет, там не было неудачного релиза, развернутого сразу и везде. Все было гораздо интереснее.

https://habr.com/ru/companies/beget/articles/1009300/

#4ESS #SS7 #эпический_баг #ошибка #каскадный_сбой #телекоммуникации #тестирование #1990 #надёжность

#надёжность #тестирование #телекоммуникации #каскадный_сбой #ошибка #эпический_баг

Habr @[email protected] · 2026-03-18 · 07:12 UTC

Эпические баги: как один Break положил телефонную сеть по всему США в 1990 г

В подразделении, где я работаю, есть традиция - новичку при онбординге вручается ссылка на Wiki с легендарными багами, приведшими к заметным последствиям. Недавно мне пришла в голову идея сделать такую же страницу, но уже со ссылками на Хабр, потому что на русском о багах пишут с бОльшим огоньком. Но, увы, оказалось, что каскадному падению серверов AT&T 15 января 1990 года внимание как-то не уделено. А ведь история получилась, прямо-таки эпическая. Итак, 15 января 1990 года из-за одной строчки кода телефонная сеть AT&T получила 9 часов даунтайма, 70 миллионов несовершенных звонков, а общий убыток насчитали в $60 миллионов еще не инфляционных долларов. И нет, там не было неудачного релиза, развернутого сразу и везде. Все было гораздо интереснее.

https://habr.com/ru/companies/beget/articles/1009300/

#4ESS #SS7 #эпический_баг #ошибка #каскадный_сбой #телекоммуникации #тестирование #1990 #надёжность

#надёжность #тестирование #телекоммуникации #каскадный_сбой #ошибка #эпический_баг

Habr @[email protected] · 2026-03-18 · 07:12 UTC

Эпические баги: как один Break положил телефонную сеть по всему США в 1990 г

В подразделении, где я работаю, есть традиция - новичку при онбординге вручается ссылка на Wiki с легендарными багами, приведшими к заметным последствиям. Недавно мне пришла в голову идея сделать такую же страницу, но уже со ссылками на Хабр, потому что на русском о багах пишут с бОльшим огоньком. Но, увы, оказалось, что каскадному падению серверов AT&T 15 января 1990 года внимание как-то не уделено. А ведь история получилась, прямо-таки эпическая. Итак, 15 января 1990 года из-за одной строчки кода телефонная сеть AT&T получила 9 часов даунтайма, 70 миллионов несовершенных звонков, а общий убыток насчитали в $60 миллионов еще не инфляционных долларов. И нет, там не было неудачного релиза, развернутого сразу и везде. Все было гораздо интереснее.

https://habr.com/ru/companies/beget/articles/1009300/

#4ESS #SS7 #эпический_баг #ошибка #каскадный_сбой #телекоммуникации #тестирование #1990 #надёжность

#надёжность #тестирование #телекоммуникации #каскадный_сбой #ошибка #эпический_баг

Habr @[email protected] · 2026-03-18 · 07:12 UTC

Эпические баги: как один Break положил телефонную сеть по всему США в 1990 г

В подразделении, где я работаю, есть традиция - новичку при онбординге вручается ссылка на Wiki с легендарными багами, приведшими к заметным последствиям. Недавно мне пришла в голову идея сделать такую же страницу, но уже со ссылками на Хабр, потому что на русском о багах пишут с бОльшим огоньком. Но, увы, оказалось, что каскадному падению серверов AT&T 15 января 1990 года внимание как-то не уделено. А ведь история получилась, прямо-таки эпическая. Итак, 15 января 1990 года из-за одной строчки кода телефонная сеть AT&T получила 9 часов даунтайма, 70 миллионов несовершенных звонков, а общий убыток насчитали в $60 миллионов еще не инфляционных долларов. И нет, там не было неудачного релиза, развернутого сразу и везде. Все было гораздо интереснее.

https://habr.com/ru/companies/beget/articles/1009300/

#4ESS #SS7 #эпический_баг #ошибка #каскадный_сбой #телекоммуникации #тестирование #1990 #надёжность

#4ess #ss7 #эпический_баг #ошибка #каскадный_сбой #телекоммуникации

Habr @[email protected] · 2025-11-14 · 13:12 UTC

Хрупкий == надёжный? Идея «хрустального кода»

Я расскажу о своём подходе к программированию под условным названием «хрустальный код», когда за счёт строго следования спецификациям методов и путём минимизации проверок и валидаций мы создаём быстрое и надёжное ПО.

https://habr.com/ru/companies/ruvds/articles/966486/

#программирование #проверки #хрупкий_код #надёжный_код #надёжность #ruvds_статьи

#ruvds_статьи #надёжность #надёжный_код #хрупкий_код #проверки #программирование

Habr @[email protected] · 2025-11-14 · 13:12 UTC

Хрупкий == надёжный? Идея «хрустального кода»

Я расскажу о своём подходе к программированию под условным названием «хрустальный код», когда за счёт строго следования спецификациям методов и путём минимизации проверок и валидаций мы создаём быстрое и надёжное ПО.

https://habr.com/ru/companies/ruvds/articles/966486/

#программирование #проверки #хрупкий_код #надёжный_код #надёжность #ruvds_статьи

#ruvds_статьи #надёжность #надёжный_код #хрупкий_код #проверки #программирование

Habr @[email protected] · 2025-11-14 · 13:12 UTC

Хрупкий == надёжный? Идея «хрустального кода»

Я расскажу о своём подходе к программированию под условным названием «хрустальный код», когда за счёт строго следования спецификациям методов и путём минимизации проверок и валидаций мы создаём быстрое и надёжное ПО.

https://habr.com/ru/companies/ruvds/articles/966486/

#программирование #проверки #хрупкий_код #надёжный_код #надёжность #ruvds_статьи

#ruvds_статьи #надёжность #надёжный_код #хрупкий_код #проверки #программирование

Habr @[email protected] · 2025-11-14 · 13:12 UTC

Хрупкий == надёжный? Идея «хрустального кода»

Я расскажу о своём подходе к программированию под условным названием «хрустальный код», когда за счёт строго следования спецификациям методов и путём минимизации проверок и валидаций мы создаём быстрое и надёжное ПО.

https://habr.com/ru/companies/ruvds/articles/966486/

#программирование #проверки #хрупкий_код #надёжный_код #надёжность #ruvds_статьи

Habr @[email protected] · 2024-06-16 · 18:42 UTC

Построение надёжных систем из ненадёжных агентов

Большие языковые модели можно применять для разных практических целей. Одно из самых интересных направлений — это автономные AI-агенты. Если сгенерировать большое количество агентов по заданному запросу и заставить их конкурировать друг с другом, то теоретически можно получить оптимальный результат по данной проблеме. Это можно использовать и в информационной безопасности, и в других сферах программной разработки. Кроме того, можно создавать агентов, то есть софт, который самостоятельно эволюционирует и улучшает себя на базе обратной связи от пользователей.

https://habr.com/ru/companies/globalsign/articles/822169/

#агенты #overkiLLM #ollama #LLM #DAG #DAGWorks #Burr #AIагенты #надёжность #Retrieval_Augmented_Generation #RAG #Instructor #prompt_engineering #openllmetry #openinference #OpenTelemetry #pgvector #RAGatouille

#ragatouille #pgvector #opentelemetry #openinference #openllmetry #prompt_engineering

Habr @[email protected] · 2024-06-16 · 18:42 UTC

Построение надёжных систем из ненадёжных агентов

Большие языковые модели можно применять для разных практических целей. Одно из самых интересных направлений — это автономные AI-агенты. Если сгенерировать большое количество агентов по заданному запросу и заставить их конкурировать друг с другом, то теоретически можно получить оптимальный результат по данной проблеме. Это можно использовать и в информационной безопасности, и в других сферах программной разработки. Кроме того, можно создавать агентов, то есть софт, который самостоятельно эволюционирует и улучшает себя на базе обратной связи от пользователей.

https://habr.com/ru/companies/globalsign/articles/822169/

#агенты #overkiLLM #ollama #LLM #DAG #DAGWorks #Burr #AIагенты #надёжность #Retrieval_Augmented_Generation #RAG #Instructor #prompt_engineering #openllmetry #openinference #OpenTelemetry #pgvector #RAGatouille

#ragatouille #pgvector #opentelemetry #openinference #openllmetry #prompt_engineering

Habr @[email protected] · 2024-06-16 · 18:42 UTC

Построение надёжных систем из ненадёжных агентов

Большие языковые модели можно применять для разных практических целей. Одно из самых интересных направлений — это автономные AI-агенты. Если сгенерировать большое количество агентов по заданному запросу и заставить их конкурировать друг с другом, то теоретически можно получить оптимальный результат по данной проблеме. Это можно использовать и в информационной безопасности, и в других сферах программной разработки. Кроме того, можно создавать агентов, то есть софт, который самостоятельно эволюционирует и улучшает себя на базе обратной связи от пользователей.

https://habr.com/ru/companies/globalsign/articles/822169/

#агенты #overkiLLM #ollama #LLM #DAG #DAGWorks #Burr #AIагенты #надёжность #Retrieval_Augmented_Generation #RAG #Instructor #prompt_engineering #openllmetry #openinference #OpenTelemetry #pgvector #RAGatouille

#агенты #overkillm #ollama #llm #dag #dagworks