#надёжность — Public Fediverse posts
Live and recent posts from across the Fediverse tagged #надёжность, aggregated by home.social.
-
Кто мониторит монитор? Рекурсивная задача, у которой нет чистого решения
У вас есть Grafana. Она показывает графики с Prometheus. Prometheus скрейпит метрики с ваших сервисов. Если сервис упал — вы видите красный на дашборде. Если Prometheus упал — вы не видите ничего. Дашборд замирает на последних известных значениях. Если не знать, что Prometheus лежит, можно час смотреть на «зелёный» дашборд, который на самом деле показывает данные часовой давности. Это не гипотетика. Я видел это дважды.
https://habr.com/ru/articles/1023188/
#мониторинг #observability #devops #надёжность #sre #архитектура #отказоустойчивость
-
Кто мониторит монитор? Рекурсивная задача, у которой нет чистого решения
У вас есть Grafana. Она показывает графики с Prometheus. Prometheus скрейпит метрики с ваших сервисов. Если сервис упал — вы видите красный на дашборде. Если Prometheus упал — вы не видите ничего. Дашборд замирает на последних известных значениях. Если не знать, что Prometheus лежит, можно час смотреть на «зелёный» дашборд, который на самом деле показывает данные часовой давности. Это не гипотетика. Я видел это дважды.
https://habr.com/ru/articles/1023188/
#мониторинг #observability #devops #надёжность #sre #архитектура #отказоустойчивость
-
Кто мониторит монитор? Рекурсивная задача, у которой нет чистого решения
У вас есть Grafana. Она показывает графики с Prometheus. Prometheus скрейпит метрики с ваших сервисов. Если сервис упал — вы видите красный на дашборде. Если Prometheus упал — вы не видите ничего. Дашборд замирает на последних известных значениях. Если не знать, что Prometheus лежит, можно час смотреть на «зелёный» дашборд, который на самом деле показывает данные часовой давности. Это не гипотетика. Я видел это дважды.
https://habr.com/ru/articles/1023188/
#мониторинг #observability #devops #надёжность #sre #архитектура #отказоустойчивость
-
Кто мониторит монитор? Рекурсивная задача, у которой нет чистого решения
У вас есть Grafana. Она показывает графики с Prometheus. Prometheus скрейпит метрики с ваших сервисов. Если сервис упал — вы видите красный на дашборде. Если Prometheus упал — вы не видите ничего. Дашборд замирает на последних известных значениях. Если не знать, что Prometheus лежит, можно час смотреть на «зелёный» дашборд, который на самом деле показывает данные часовой давности. Это не гипотетика. Я видел это дважды.
https://habr.com/ru/articles/1023188/
#мониторинг #observability #devops #надёжность #sre #архитектура #отказоустойчивость
-
Эпические баги: как один Break положил телефонную сеть по всему США в 1990 г
В подразделении, где я работаю, есть традиция - новичку при онбординге вручается ссылка на Wiki с легендарными багами, приведшими к заметным последствиям. Недавно мне пришла в голову идея сделать такую же страницу, но уже со ссылками на Хабр, потому что на русском о багах пишут с бОльшим огоньком. Но, увы, оказалось, что каскадному падению серверов AT&T 15 января 1990 года внимание как-то не уделено. А ведь история получилась, прямо-таки эпическая. Итак, 15 января 1990 года из-за одной строчки кода телефонная сеть AT&T получила 9 часов даунтайма, 70 миллионов несовершенных звонков, а общий убыток насчитали в $60 миллионов еще не инфляционных долларов. И нет, там не было неудачного релиза, развернутого сразу и везде. Все было гораздо интереснее.
https://habr.com/ru/companies/beget/articles/1009300/
#4ESS #SS7 #эпический_баг #ошибка #каскадный_сбой #телекоммуникации #тестирование #1990 #надёжность
-
Эпические баги: как один Break положил телефонную сеть по всему США в 1990 г
В подразделении, где я работаю, есть традиция - новичку при онбординге вручается ссылка на Wiki с легендарными багами, приведшими к заметным последствиям. Недавно мне пришла в голову идея сделать такую же страницу, но уже со ссылками на Хабр, потому что на русском о багах пишут с бОльшим огоньком. Но, увы, оказалось, что каскадному падению серверов AT&T 15 января 1990 года внимание как-то не уделено. А ведь история получилась, прямо-таки эпическая. Итак, 15 января 1990 года из-за одной строчки кода телефонная сеть AT&T получила 9 часов даунтайма, 70 миллионов несовершенных звонков, а общий убыток насчитали в $60 миллионов еще не инфляционных долларов. И нет, там не было неудачного релиза, развернутого сразу и везде. Все было гораздо интереснее.
https://habr.com/ru/companies/beget/articles/1009300/
#4ESS #SS7 #эпический_баг #ошибка #каскадный_сбой #телекоммуникации #тестирование #1990 #надёжность
-
Эпические баги: как один Break положил телефонную сеть по всему США в 1990 г
В подразделении, где я работаю, есть традиция - новичку при онбординге вручается ссылка на Wiki с легендарными багами, приведшими к заметным последствиям. Недавно мне пришла в голову идея сделать такую же страницу, но уже со ссылками на Хабр, потому что на русском о багах пишут с бОльшим огоньком. Но, увы, оказалось, что каскадному падению серверов AT&T 15 января 1990 года внимание как-то не уделено. А ведь история получилась, прямо-таки эпическая. Итак, 15 января 1990 года из-за одной строчки кода телефонная сеть AT&T получила 9 часов даунтайма, 70 миллионов несовершенных звонков, а общий убыток насчитали в $60 миллионов еще не инфляционных долларов. И нет, там не было неудачного релиза, развернутого сразу и везде. Все было гораздо интереснее.
https://habr.com/ru/companies/beget/articles/1009300/
#4ESS #SS7 #эпический_баг #ошибка #каскадный_сбой #телекоммуникации #тестирование #1990 #надёжность
-
Эпические баги: как один Break положил телефонную сеть по всему США в 1990 г
В подразделении, где я работаю, есть традиция - новичку при онбординге вручается ссылка на Wiki с легендарными багами, приведшими к заметным последствиям. Недавно мне пришла в голову идея сделать такую же страницу, но уже со ссылками на Хабр, потому что на русском о багах пишут с бОльшим огоньком. Но, увы, оказалось, что каскадному падению серверов AT&T 15 января 1990 года внимание как-то не уделено. А ведь история получилась, прямо-таки эпическая. Итак, 15 января 1990 года из-за одной строчки кода телефонная сеть AT&T получила 9 часов даунтайма, 70 миллионов несовершенных звонков, а общий убыток насчитали в $60 миллионов еще не инфляционных долларов. И нет, там не было неудачного релиза, развернутого сразу и везде. Все было гораздо интереснее.
https://habr.com/ru/companies/beget/articles/1009300/
#4ESS #SS7 #эпический_баг #ошибка #каскадный_сбой #телекоммуникации #тестирование #1990 #надёжность
-
Хрупкий == надёжный? Идея «хрустального кода»
Я расскажу о своём подходе к программированию под условным названием «хрустальный код», когда за счёт строго следования спецификациям методов и путём минимизации проверок и валидаций мы создаём быстрое и надёжное ПО.
https://habr.com/ru/companies/ruvds/articles/966486/
#программирование #проверки #хрупкий_код #надёжный_код #надёжность #ruvds_статьи
-
Хрупкий == надёжный? Идея «хрустального кода»
Я расскажу о своём подходе к программированию под условным названием «хрустальный код», когда за счёт строго следования спецификациям методов и путём минимизации проверок и валидаций мы создаём быстрое и надёжное ПО.
https://habr.com/ru/companies/ruvds/articles/966486/
#программирование #проверки #хрупкий_код #надёжный_код #надёжность #ruvds_статьи
-
Хрупкий == надёжный? Идея «хрустального кода»
Я расскажу о своём подходе к программированию под условным названием «хрустальный код», когда за счёт строго следования спецификациям методов и путём минимизации проверок и валидаций мы создаём быстрое и надёжное ПО.
https://habr.com/ru/companies/ruvds/articles/966486/
#программирование #проверки #хрупкий_код #надёжный_код #надёжность #ruvds_статьи
-
Хрупкий == надёжный? Идея «хрустального кода»
Я расскажу о своём подходе к программированию под условным названием «хрустальный код», когда за счёт строго следования спецификациям методов и путём минимизации проверок и валидаций мы создаём быстрое и надёжное ПО.
https://habr.com/ru/companies/ruvds/articles/966486/
#программирование #проверки #хрупкий_код #надёжный_код #надёжность #ruvds_статьи
-
Построение надёжных систем из ненадёжных агентов
Большие языковые модели можно применять для разных практических целей. Одно из самых интересных направлений — это автономные AI-агенты. Если сгенерировать большое количество агентов по заданному запросу и заставить их конкурировать друг с другом, то теоретически можно получить оптимальный результат по данной проблеме. Это можно использовать и в информационной безопасности, и в других сферах программной разработки. Кроме того, можно создавать агентов, то есть софт, который самостоятельно эволюционирует и улучшает себя на базе обратной связи от пользователей.
https://habr.com/ru/companies/globalsign/articles/822169/
#агенты #overkiLLM #ollama #LLM #DAG #DAGWorks #Burr #AIагенты #надёжность #Retrieval_Augmented_Generation #RAG #Instructor #prompt_engineering #openllmetry #openinference #OpenTelemetry #pgvector #RAGatouille
-
Построение надёжных систем из ненадёжных агентов
Большие языковые модели можно применять для разных практических целей. Одно из самых интересных направлений — это автономные AI-агенты. Если сгенерировать большое количество агентов по заданному запросу и заставить их конкурировать друг с другом, то теоретически можно получить оптимальный результат по данной проблеме. Это можно использовать и в информационной безопасности, и в других сферах программной разработки. Кроме того, можно создавать агентов, то есть софт, который самостоятельно эволюционирует и улучшает себя на базе обратной связи от пользователей.
https://habr.com/ru/companies/globalsign/articles/822169/
#агенты #overkiLLM #ollama #LLM #DAG #DAGWorks #Burr #AIагенты #надёжность #Retrieval_Augmented_Generation #RAG #Instructor #prompt_engineering #openllmetry #openinference #OpenTelemetry #pgvector #RAGatouille
-
Построение надёжных систем из ненадёжных агентов
Большие языковые модели можно применять для разных практических целей. Одно из самых интересных направлений — это автономные AI-агенты. Если сгенерировать большое количество агентов по заданному запросу и заставить их конкурировать друг с другом, то теоретически можно получить оптимальный результат по данной проблеме. Это можно использовать и в информационной безопасности, и в других сферах программной разработки. Кроме того, можно создавать агентов, то есть софт, который самостоятельно эволюционирует и улучшает себя на базе обратной связи от пользователей.
https://habr.com/ru/companies/globalsign/articles/822169/
#агенты #overkiLLM #ollama #LLM #DAG #DAGWorks #Burr #AIагенты #надёжность #Retrieval_Augmented_Generation #RAG #Instructor #prompt_engineering #openllmetry #openinference #OpenTelemetry #pgvector #RAGatouille