#траблшутинг — Public Fediverse posts
Live and recent posts from across the Fediverse tagged #траблшутинг, aggregated by home.social.
-
kubectl describe pod: как читать вывод, в котором Kubernetes уже написал причину
Статья о том, как читать kubectl describe pod не как длинный вывод, а как историю жизни Pod’а: кто его создал, куда его пытались поставить, скачался ли image, стартовали ли init containers, что случилось с probes, volumes, restarts и Events. Постарался сделать материал дружелюбным для джунов и мидлов, но без упрощения до «введите команду и посмотрите статус». Тут много реальной эксплуатации: Pending , CrashLoopBackOff , ImagePullBackOff , OOMKilled , FailedMount , CreateContainerConfigError , Evicted и любимое «Pod Running, но сервис не работает». Если вам нужна не вся теория, а быстрая шпаргалка для инцидента — в конце статьи есть компактная схема : что смотреть в kubectl describe pod при Pending , CrashLoopBackOff , ImagePullBackOff , OOMKilled , FailedMount и других типовых состояниях. Можно сразу перейти к ней, сохранить и использовать как чек-лист. А если хочется понять не только «куда смотреть», но и почему Kubernetes ведёт себя именно так — дальше разберём describe вместе по шагам.
https://habr.com/ru/articles/1031454/
#devops #kubernetes #pod #дебаг #девопс #траблшутинг #кубер #debug #observability #oomkill
-
kubectl describe pod: как читать вывод, в котором Kubernetes уже написал причину
Статья о том, как читать kubectl describe pod не как длинный вывод, а как историю жизни Pod’а: кто его создал, куда его пытались поставить, скачался ли image, стартовали ли init containers, что случилось с probes, volumes, restarts и Events. Постарался сделать материал дружелюбным для джунов и мидлов, но без упрощения до «введите команду и посмотрите статус». Тут много реальной эксплуатации: Pending , CrashLoopBackOff , ImagePullBackOff , OOMKilled , FailedMount , CreateContainerConfigError , Evicted и любимое «Pod Running, но сервис не работает». Если вам нужна не вся теория, а быстрая шпаргалка для инцидента — в конце статьи есть компактная схема : что смотреть в kubectl describe pod при Pending , CrashLoopBackOff , ImagePullBackOff , OOMKilled , FailedMount и других типовых состояниях. Можно сразу перейти к ней, сохранить и использовать как чек-лист. А если хочется понять не только «куда смотреть», но и почему Kubernetes ведёт себя именно так — дальше разберём describe вместе по шагам.
https://habr.com/ru/articles/1031454/
#devops #kubernetes #pod #дебаг #девопс #траблшутинг #кубер #debug #observability #oomkill
-
kubectl describe pod: как читать вывод, в котором Kubernetes уже написал причину
Статья о том, как читать kubectl describe pod не как длинный вывод, а как историю жизни Pod’а: кто его создал, куда его пытались поставить, скачался ли image, стартовали ли init containers, что случилось с probes, volumes, restarts и Events. Постарался сделать материал дружелюбным для джунов и мидлов, но без упрощения до «введите команду и посмотрите статус». Тут много реальной эксплуатации: Pending , CrashLoopBackOff , ImagePullBackOff , OOMKilled , FailedMount , CreateContainerConfigError , Evicted и любимое «Pod Running, но сервис не работает». Если вам нужна не вся теория, а быстрая шпаргалка для инцидента — в конце статьи есть компактная схема : что смотреть в kubectl describe pod при Pending , CrashLoopBackOff , ImagePullBackOff , OOMKilled , FailedMount и других типовых состояниях. Можно сразу перейти к ней, сохранить и использовать как чек-лист. А если хочется понять не только «куда смотреть», но и почему Kubernetes ведёт себя именно так — дальше разберём describe вместе по шагам.
https://habr.com/ru/articles/1031454/
#devops #kubernetes #pod #дебаг #девопс #траблшутинг #кубер #debug #observability #oomkill
-
kubectl describe pod: как читать вывод, в котором Kubernetes уже написал причину
Статья о том, как читать kubectl describe pod не как длинный вывод, а как историю жизни Pod’а: кто его создал, куда его пытались поставить, скачался ли image, стартовали ли init containers, что случилось с probes, volumes, restarts и Events. Постарался сделать материал дружелюбным для джунов и мидлов, но без упрощения до «введите команду и посмотрите статус». Тут много реальной эксплуатации: Pending , CrashLoopBackOff , ImagePullBackOff , OOMKilled , FailedMount , CreateContainerConfigError , Evicted и любимое «Pod Running, но сервис не работает». Если вам нужна не вся теория, а быстрая шпаргалка для инцидента — в конце статьи есть компактная схема : что смотреть в kubectl describe pod при Pending , CrashLoopBackOff , ImagePullBackOff , OOMKilled , FailedMount и других типовых состояниях. Можно сразу перейти к ней, сохранить и использовать как чек-лист. А если хочется понять не только «куда смотреть», но и почему Kubernetes ведёт себя именно так — дальше разберём describe вместе по шагам.
https://habr.com/ru/articles/1031454/
#devops #kubernetes #pod #дебаг #девопс #траблшутинг #кубер #debug #observability #oomkill
-
Я календарь переверну — и снова 5 апреля: CPU-утилизация во имя интернационализации
Недавно наша команда столкнулась с необычным поведением системы, которая начала использовать избыточное количество CPU-ресурсов. В начале года мы запустили миграцию сервиса в новое хранилище PostgreSQL с существующего NoSQL-решения. Сервис среднестатистический, не High-Load, но занимает ключевое место в обработке бизнес-процессов, отвечает за генерацию заданий для коммуникаций с клиентами. Без проблем держит поступающие 30 RPS, ежедневно обрабатывает около миллиона джобов, хранит сотни миллионов строк данных и в среднем потребляет 125ms CPU. До отключения старой инфраструктуры оставались считаные дни, в бэклоге было несколько задач на миграцию, и мы стремились уложиться в сроки. В бэкграунде крутились джобы миграции данных в новую базу, десятки фичатоглов распределяли запросы к базам данных по репозиториям для обратной совместимости, но планы рухнули из-за неожиданного поведения системы.
https://habr.com/ru/companies/tbank/articles/1021330/
#траблшутинг #потребление_ресурсов #таймзона #профайлинг #дамп
-
Я календарь переверну — и снова 5 апреля: CPU-утилизация во имя интернационализации
Недавно наша команда столкнулась с необычным поведением системы, которая начала использовать избыточное количество CPU-ресурсов. В начале года мы запустили миграцию сервиса в новое хранилище PostgreSQL с существующего NoSQL-решения. Сервис среднестатистический, не High-Load, но занимает ключевое место в обработке бизнес-процессов, отвечает за генерацию заданий для коммуникаций с клиентами. Без проблем держит поступающие 30 RPS, ежедневно обрабатывает около миллиона джобов, хранит сотни миллионов строк данных и в среднем потребляет 125ms CPU. До отключения старой инфраструктуры оставались считаные дни, в бэклоге было несколько задач на миграцию, и мы стремились уложиться в сроки. В бэкграунде крутились джобы миграции данных в новую базу, десятки фичатоглов распределяли запросы к базам данных по репозиториям для обратной совместимости, но планы рухнули из-за неожиданного поведения системы.
https://habr.com/ru/companies/tbank/articles/1021330/
#траблшутинг #потребление_ресурсов #таймзона #профайлинг #дамп
-
Я календарь переверну — и снова 5 апреля: CPU-утилизация во имя интернационализации
Недавно наша команда столкнулась с необычным поведением системы, которая начала использовать избыточное количество CPU-ресурсов. В начале года мы запустили миграцию сервиса в новое хранилище PostgreSQL с существующего NoSQL-решения. Сервис среднестатистический, не High-Load, но занимает ключевое место в обработке бизнес-процессов, отвечает за генерацию заданий для коммуникаций с клиентами. Без проблем держит поступающие 30 RPS, ежедневно обрабатывает около миллиона джобов, хранит сотни миллионов строк данных и в среднем потребляет 125ms CPU. До отключения старой инфраструктуры оставались считаные дни, в бэклоге было несколько задач на миграцию, и мы стремились уложиться в сроки. В бэкграунде крутились джобы миграции данных в новую базу, десятки фичатоглов распределяли запросы к базам данных по репозиториям для обратной совместимости, но планы рухнули из-за неожиданного поведения системы.
https://habr.com/ru/companies/tbank/articles/1021330/
#траблшутинг #потребление_ресурсов #таймзона #профайлинг #дамп
-
Я календарь переверну — и снова 5 апреля: CPU-утилизация во имя интернационализации
Недавно наша команда столкнулась с необычным поведением системы, которая начала использовать избыточное количество CPU-ресурсов. В начале года мы запустили миграцию сервиса в новое хранилище PostgreSQL с существующего NoSQL-решения. Сервис среднестатистический, не High-Load, но занимает ключевое место в обработке бизнес-процессов, отвечает за генерацию заданий для коммуникаций с клиентами. Без проблем держит поступающие 30 RPS, ежедневно обрабатывает около миллиона джобов, хранит сотни миллионов строк данных и в среднем потребляет 125ms CPU. До отключения старой инфраструктуры оставались считаные дни, в бэклоге было несколько задач на миграцию, и мы стремились уложиться в сроки. В бэкграунде крутились джобы миграции данных в новую базу, десятки фичатоглов распределяли запросы к базам данных по репозиториям для обратной совместимости, но планы рухнули из-за неожиданного поведения системы.
https://habr.com/ru/companies/tbank/articles/1021330/
#траблшутинг #потребление_ресурсов #таймзона #профайлинг #дамп
-
Как убедить стол не таскать за собой чашки. Пошаговая отладка промпта в txt2img-сервисах
Летнее утро на даче… Как такое не запечатлеть с помощью нейросетей! Цветущий сад, собака под ногами и тихо урчащая кофемашина, наливающая чашку крепкого ароматного напитка. Одну чашку. Казалось бы, ничего сложного. Садимся и набираем простой линейный промпт «что вижу, то пою», а модель сама всё нарисует. Не тут-то было. Зачастую простейшая казалось бы задача упирается в серьезную проблему в результате скрытых настроек и правил инструмента. Например, мы просим нарисовать одну чашку, а на картинке их постоянно две или больше. Исправить это можно либо с помощью множества итераций с применением средств отладки и перебором промптов. Но также интересно решить задачу через понимание и использование принципов работы нейросетей. Тут я покажу второй путь.
https://habr.com/ru/companies/ru_mts/articles/933132/
#промптинг #контекстная_инженерия #чашка_кофе #txt2img #траблшутинг #нейросети
-
Как убедить стол не таскать за собой чашки. Пошаговая отладка промпта в txt2img-сервисах
Летнее утро на даче… Как такое не запечатлеть с помощью нейросетей! Цветущий сад, собака под ногами и тихо урчащая кофемашина, наливающая чашку крепкого ароматного напитка. Одну чашку. Казалось бы, ничего сложного. Садимся и набираем простой линейный промпт «что вижу, то пою», а модель сама всё нарисует. Не тут-то было. Зачастую простейшая казалось бы задача упирается в серьезную проблему в результате скрытых настроек и правил инструмента. Например, мы просим нарисовать одну чашку, а на картинке их постоянно две или больше. Исправить это можно либо с помощью множества итераций с применением средств отладки и перебором промптов. Но также интересно решить задачу через понимание и использование принципов работы нейросетей. Тут я покажу второй путь.
https://habr.com/ru/companies/ru_mts/articles/933132/
#промптинг #контекстная_инженерия #чашка_кофе #txt2img #траблшутинг #нейросети
-
Как убедить стол не таскать за собой чашки. Пошаговая отладка промпта в txt2img-сервисах
Летнее утро на даче… Как такое не запечатлеть с помощью нейросетей! Цветущий сад, собака под ногами и тихо урчащая кофемашина, наливающая чашку крепкого ароматного напитка. Одну чашку. Казалось бы, ничего сложного. Садимся и набираем простой линейный промпт «что вижу, то пою», а модель сама всё нарисует. Не тут-то было. Зачастую простейшая казалось бы задача упирается в серьезную проблему в результате скрытых настроек и правил инструмента. Например, мы просим нарисовать одну чашку, а на картинке их постоянно две или больше. Исправить это можно либо с помощью множества итераций с применением средств отладки и перебором промптов. Но также интересно решить задачу через понимание и использование принципов работы нейросетей. Тут я покажу второй путь.
https://habr.com/ru/companies/ru_mts/articles/933132/
#промптинг #контекстная_инженерия #чашка_кофе #txt2img #траблшутинг #нейросети
-
Как убедить стол не таскать за собой чашки. Пошаговая отладка промпта в txt2img-сервисах
Летнее утро на даче… Как такое не запечатлеть с помощью нейросетей! Цветущий сад, собака под ногами и тихо урчащая кофемашина, наливающая чашку крепкого ароматного напитка. Одну чашку. Казалось бы, ничего сложного. Садимся и набираем простой линейный промпт «что вижу, то пою», а модель сама всё нарисует. Не тут-то было. Зачастую простейшая казалось бы задача упирается в серьезную проблему в результате скрытых настроек и правил инструмента. Например, мы просим нарисовать одну чашку, а на картинке их постоянно две или больше. Исправить это можно либо с помощью множества итераций с применением средств отладки и перебором промптов. Но также интересно решить задачу через понимание и использование принципов работы нейросетей. Тут я покажу второй путь.
https://habr.com/ru/companies/ru_mts/articles/933132/
#промптинг #контекстная_инженерия #чашка_кофе #txt2img #траблшутинг #нейросети
-
ТРИЗ и Траблшутинг, что такое troubleshooting в бизнесе и кто такой troubleshooter (траблшутер)
В последние годы в бизнес-среде России стал популярен такой термин, как «траблшутинг». В России он овеян легендами. Существует мнение, что траблшутер – это человек, работающий за огромные деньги, который находит решения проблем за считаные часы, почти всегда секретно, и посредством этих решений, приносит корпорациям огромные деньги. Своего рода секретный агент на службе бизнеса. Два самых известных в русскоязычной среде кейса про траблшутинг: 1. про кроссовки Nike. 2. про использование простых карандашей в космосе. В первом случае легенда гласит, что компания Nike решила выпускать свою продукцию в Африке, потому что рабочая сила там была очень дешёвой. Через время, руководство фабрики столкнулось с массовым воровством. В кроссовках стоимостью в несколько месячных зарплат стали ходить не только работники, но и все члены их семей. Бороться с воровством было почти невозможно, ведь охрана тоже состояла из местных. Когда стало понятно, что кражи, приносящие бизнесу колоссальный урон, не остановить, руководство подумало и пригласило гениального траблшутера. И тот, якобы немного подумав, придумал не менее «гениальное» решение: компании стоит выпускать правые и левые кроссовки в разных странах. Тогда воровать будет невозможно. Но дело в том, что эта история популярна исключительно в русскоязычном интернете. Никто никогда не видел пару кроссовок Nike, в которой правый и левый кроссовок были бы выпущены в разных странах. Да и производства в Африке у компании никогда не было. Вторая известная легенда связана с освоением космоса. Её часто приводят примером того, как простое решение сэкономило СССР очень много денег. Якобы пока американцы разрабатывали ручку, которая бы писала в условиях невесомости, кто-то из наших специалистов предложил не тратить деньги, а нашим космонавтам посоветовал писать простыми карандашами.
-
ТРИЗ и Траблшутинг, что такое troubleshooting в бизнесе и кто такой troubleshooter (траблшутер)
В последние годы в бизнес-среде России стал популярен такой термин, как «траблшутинг». В России он овеян легендами. Существует мнение, что траблшутер – это человек, работающий за огромные деньги, который находит решения проблем за считаные часы, почти всегда секретно, и посредством этих решений, приносит корпорациям огромные деньги. Своего рода секретный агент на службе бизнеса. Два самых известных в русскоязычной среде кейса про траблшутинг: 1. про кроссовки Nike. 2. про использование простых карандашей в космосе. В первом случае легенда гласит, что компания Nike решила выпускать свою продукцию в Африке, потому что рабочая сила там была очень дешёвой. Через время, руководство фабрики столкнулось с массовым воровством. В кроссовках стоимостью в несколько месячных зарплат стали ходить не только работники, но и все члены их семей. Бороться с воровством было почти невозможно, ведь охрана тоже состояла из местных. Когда стало понятно, что кражи, приносящие бизнесу колоссальный урон, не остановить, руководство подумало и пригласило гениального траблшутера. И тот, якобы немного подумав, придумал не менее «гениальное» решение: компании стоит выпускать правые и левые кроссовки в разных странах. Тогда воровать будет невозможно. Но дело в том, что эта история популярна исключительно в русскоязычном интернете. Никто никогда не видел пару кроссовок Nike, в которой правый и левый кроссовок были бы выпущены в разных странах. Да и производства в Африке у компании никогда не было. Вторая известная легенда связана с освоением космоса. Её часто приводят примером того, как простое решение сэкономило СССР очень много денег. Якобы пока американцы разрабатывали ручку, которая бы писала в условиях невесомости, кто-то из наших специалистов предложил не тратить деньги, а нашим космонавтам посоветовал писать простыми карандашами.
-
ТРИЗ и Траблшутинг, что такое troubleshooting в бизнесе и кто такой troubleshooter (траблшутер)
В последние годы в бизнес-среде России стал популярен такой термин, как «траблшутинг». В России он овеян легендами. Существует мнение, что траблшутер – это человек, работающий за огромные деньги, который находит решения проблем за считаные часы, почти всегда секретно, и посредством этих решений, приносит корпорациям огромные деньги. Своего рода секретный агент на службе бизнеса. Два самых известных в русскоязычной среде кейса про траблшутинг: 1. про кроссовки Nike. 2. про использование простых карандашей в космосе. В первом случае легенда гласит, что компания Nike решила выпускать свою продукцию в Африке, потому что рабочая сила там была очень дешёвой. Через время, руководство фабрики столкнулось с массовым воровством. В кроссовках стоимостью в несколько месячных зарплат стали ходить не только работники, но и все члены их семей. Бороться с воровством было почти невозможно, ведь охрана тоже состояла из местных. Когда стало понятно, что кражи, приносящие бизнесу колоссальный урон, не остановить, руководство подумало и пригласило гениального траблшутера. И тот, якобы немного подумав, придумал не менее «гениальное» решение: компании стоит выпускать правые и левые кроссовки в разных странах. Тогда воровать будет невозможно. Но дело в том, что эта история популярна исключительно в русскоязычном интернете. Никто никогда не видел пару кроссовок Nike, в которой правый и левый кроссовок были бы выпущены в разных странах. Да и производства в Африке у компании никогда не было. Вторая известная легенда связана с освоением космоса. Её часто приводят примером того, как простое решение сэкономило СССР очень много денег. Якобы пока американцы разрабатывали ручку, которая бы писала в условиях невесомости, кто-то из наших специалистов предложил не тратить деньги, а нашим космонавтам посоветовал писать простыми карандашами.
-
Как решить проблемы со звуком во время видеоконференций. Развернутый гайд для пользователей в пять шагов
Привет, Хабр! Меня зовут Дмитрий Канатьев, я руководитель группы поддержки подключений МТС Линк. Как показывает мой опыт, 90% ситуаций с неработающим звуком можно решить самостоятельно и с помощью простейших действий. Они общие для любых сервисов видеоконференций, не требуют специфических знаний и, как правило, решаются в пару кликов переключением опций, спрятанных где-то в недрах настроек. Специально для пользователей без глубокого понимания операционной системы мы собрали обширную базу знаний и проработали порядок, в котором стоит действовать. Этот гайд поможет быстро понять причину и самостоятельно исправить неполадки со звуком на онлайн-мероприятиях. Все эти операции выполняются за 5–10 минут, но экономят сотрудникам поддержки и системным администраторам время, которое они смогут потратить на просмотр аниме решение сложных и заковыристых проблем.
https://habr.com/ru/companies/ru_mts/articles/926914/
#звук #траблшутинг #как_решить_проблемы_со_звуком #видеоконференцсвязь #системное_администрирование
-
Уравнение с тремя неизвестными: как отлавливать баги в системах хранения данных
Привет! Меня зовут Никита Гуцалов, я инженер в компании YADRO и занимаюсь разработкой ПО для системы хранения данных TATLIN.UNIFIED. Вообще с системами хранения данных (СХД) я работаю уже много лет и люблю эту тему, поскольку она постоянно бросает новые вызовы, заставляя решать довольно сложные и нестандартные проблемы, что очень увлекательно само по себе, а удачные решения приносят огромное удовлетворение. В статье я попытаюсь погрузить читателя в проблемы, с которыми нам, инженерам YADRO, приходится сталкиваться при отладке программного обеспечения СХД. Также покажу особенности работы с такими системами. Расскажу, какие инструменты, а иногда и решения, которые мы пишем сами, приходится для этого применять. А еще постараюсь сформулировать условия, которые необходимы для нахождения причин возникновения ошибок обработки данных в системе. Текст про особенности поиска багов был бы пустым без конкретных примеров, поэтому под катом вас ждет разбор случая, который как-то произошел в нашей лаборатории при тестировании производительности СХД.
-
Как решить проблемы со звуком во время видеоконференций. Развернутый гайд для пользователей в пять шагов
Привет, Хабр! Меня зовут Дмитрий Канатьев, я руководитель группы поддержки подключений МТС Линк. Как показывает мой опыт, 90% ситуаций с неработающим звуком можно решить самостоятельно и с помощью простейших действий. Они общие для любых сервисов видеоконференций, не требуют специфических знаний и, как правило, решаются в пару кликов переключением опций, спрятанных где-то в недрах настроек. Специально для пользователей без глубокого понимания операционной системы мы собрали обширную базу знаний и проработали порядок, в котором стоит действовать. Этот гайд поможет быстро понять причину и самостоятельно исправить неполадки со звуком на онлайн-мероприятиях. Все эти операции выполняются за 5–10 минут, но экономят сотрудникам поддержки и системным администраторам время, которое они смогут потратить на просмотр аниме решение сложных и заковыристых проблем.
https://habr.com/ru/companies/ru_mts/articles/926914/
#звук #траблшутинг #как_решить_проблемы_со_звуком #видеоконференцсвязь #системное_администрирование
-
Как решить проблемы со звуком во время видеоконференций. Развернутый гайд для пользователей в пять шагов
Привет, Хабр! Меня зовут Дмитрий Канатьев, я руководитель группы поддержки подключений МТС Линк. Как показывает мой опыт, 90% ситуаций с неработающим звуком можно решить самостоятельно и с помощью простейших действий. Они общие для любых сервисов видеоконференций, не требуют специфических знаний и, как правило, решаются в пару кликов переключением опций, спрятанных где-то в недрах настроек. Специально для пользователей без глубокого понимания операционной системы мы собрали обширную базу знаний и проработали порядок, в котором стоит действовать. Этот гайд поможет быстро понять причину и самостоятельно исправить неполадки со звуком на онлайн-мероприятиях. Все эти операции выполняются за 5–10 минут, но экономят сотрудникам поддержки и системным администраторам время, которое они смогут потратить на просмотр аниме решение сложных и заковыристых проблем.
https://habr.com/ru/companies/ru_mts/articles/926914/
#звук #траблшутинг #как_решить_проблемы_со_звуком #видеоконференцсвязь #системное_администрирование
-
Как решить проблемы со звуком во время видеоконференций. Развернутый гайд для пользователей в пять шагов
Привет, Хабр! Меня зовут Дмитрий Канатьев, я руководитель группы поддержки подключений МТС Линк. Как показывает мой опыт, 90% ситуаций с неработающим звуком можно решить самостоятельно и с помощью простейших действий. Они общие для любых сервисов видеоконференций, не требуют специфических знаний и, как правило, решаются в пару кликов переключением опций, спрятанных где-то в недрах настроек. Специально для пользователей без глубокого понимания операционной системы мы собрали обширную базу знаний и проработали порядок, в котором стоит действовать. Этот гайд поможет быстро понять причину и самостоятельно исправить неполадки со звуком на онлайн-мероприятиях. Все эти операции выполняются за 5–10 минут, но экономят сотрудникам поддержки и системным администраторам время, которое они смогут потратить на просмотр аниме решение сложных и заковыристых проблем.
https://habr.com/ru/companies/ru_mts/articles/926914/
#звук #траблшутинг #как_решить_проблемы_со_звуком #видеоконференцсвязь #системное_администрирование
-
Уравнение с тремя неизвестными: как отлавливать баги в системах хранения данных
Привет! Меня зовут Никита Гуцалов, я инженер в компании YADRO и занимаюсь разработкой ПО для системы хранения данных TATLIN.UNIFIED. Вообще с системами хранения данных (СХД) я работаю уже много лет и люблю эту тему, поскольку она постоянно бросает новые вызовы, заставляя решать довольно сложные и нестандартные проблемы, что очень увлекательно само по себе, а удачные решения приносят огромное удовлетворение. В статье я попытаюсь погрузить читателя в проблемы, с которыми нам, инженерам YADRO, приходится сталкиваться при отладке программного обеспечения СХД. Также покажу особенности работы с такими системами. Расскажу, какие инструменты, а иногда и решения, которые мы пишем сами, приходится для этого применять. А еще постараюсь сформулировать условия, которые необходимы для нахождения причин возникновения ошибок обработки данных в системе. Текст про особенности поиска багов был бы пустым без конкретных примеров, поэтому под катом вас ждет разбор случая, который как-то произошел в нашей лаборатории при тестировании производительности СХД.
-
Уравнение с тремя неизвестными: как отлавливать баги в системах хранения данных
Привет! Меня зовут Никита Гуцалов, я инженер в компании YADRO и занимаюсь разработкой ПО для системы хранения данных TATLIN.UNIFIED. Вообще с системами хранения данных (СХД) я работаю уже много лет и люблю эту тему, поскольку она постоянно бросает новые вызовы, заставляя решать довольно сложные и нестандартные проблемы, что очень увлекательно само по себе, а удачные решения приносят огромное удовлетворение. В статье я попытаюсь погрузить читателя в проблемы, с которыми нам, инженерам YADRO, приходится сталкиваться при отладке программного обеспечения СХД. Также покажу особенности работы с такими системами. Расскажу, какие инструменты, а иногда и решения, которые мы пишем сами, приходится для этого применять. А еще постараюсь сформулировать условия, которые необходимы для нахождения причин возникновения ошибок обработки данных в системе. Текст про особенности поиска багов был бы пустым без конкретных примеров, поэтому под катом вас ждет разбор случая, который как-то произошел в нашей лаборатории при тестировании производительности СХД.