#diffindiff — Public Fediverse posts on home.social

Habr @[email protected] · 2026-01-17 · 18:42 UTC

Оценка эффекта релиза, когда изменение затронуло не всех: diff-in-diff и синтетический контроль

Когда релиз раскатан не на всех, классическая схема "до" и "после" начинает рушиться: метрика растет или падает одновременно из-за сезонности, внешнего фона и изменений в каналах, а не только из-за продукта. При этом AB теста может не быть, но данные по группам есть почти всегда: по гео, сегментам, кластерам, витринам. В этой статье разбираю два практических подхода, которые позволяют оценить эффект релиза в таких условиях. Первый - diff-in-diff: сравниваем, насколько изменилась метрика в затронутой группе относительно контрольной, и тем самым вычитаем общий фон, который влияет на всех. Второй - синтетический контроль: строим базовую линию для затронутой группы как сумму метрик нескольких контрольных групп с весами, подобранными так, чтобы до релиза эта конструкция максимально повторяла историю затронутой группы. Отдельный акцент на том, что обычно искажает выводы: заметный рост или падение разницы между группами до релиза, изменения состава, локальные акции или технические инциденты в контрольных группах, а также ситуации, когда базовая линия плохо повторяет период до релиза и тогда мы измеряем в основном ошибку модели, а не эффект релиза. В конце показываю, какие проверки стоит сделать, чтобы результат не держался на удачно выбранных границах периода или на одной контрольной группе. Если в первой части мы работали с одной временной линией метрики, то здесь переходим к более распространенному случаю: несколько групп, частичная раскатка и необходимость отделить влияние релиза от общего шума.

https://habr.com/ru/articles/986182/

#diffindiff #синтетический_контроль #synthetic_control #продуктовая_аналитика #причинный_анализ #causalimpact #оценка_эффекта #плацебо_проверки

#плацебо_проверки #оценка_эффекта #causalimpact #причинный_анализ #продуктовая_аналитика #synthetic_control

Habr @[email protected] · 2026-01-17 · 18:42 UTC

Оценка эффекта релиза, когда изменение затронуло не всех: diff-in-diff и синтетический контроль

Когда релиз раскатан не на всех, классическая схема "до" и "после" начинает рушиться: метрика растет или падает одновременно из-за сезонности, внешнего фона и изменений в каналах, а не только из-за продукта. При этом AB теста может не быть, но данные по группам есть почти всегда: по гео, сегментам, кластерам, витринам. В этой статье разбираю два практических подхода, которые позволяют оценить эффект релиза в таких условиях. Первый - diff-in-diff: сравниваем, насколько изменилась метрика в затронутой группе относительно контрольной, и тем самым вычитаем общий фон, который влияет на всех. Второй - синтетический контроль: строим базовую линию для затронутой группы как сумму метрик нескольких контрольных групп с весами, подобранными так, чтобы до релиза эта конструкция максимально повторяла историю затронутой группы. Отдельный акцент на том, что обычно искажает выводы: заметный рост или падение разницы между группами до релиза, изменения состава, локальные акции или технические инциденты в контрольных группах, а также ситуации, когда базовая линия плохо повторяет период до релиза и тогда мы измеряем в основном ошибку модели, а не эффект релиза. В конце показываю, какие проверки стоит сделать, чтобы результат не держался на удачно выбранных границах периода или на одной контрольной группе. Если в первой части мы работали с одной временной линией метрики, то здесь переходим к более распространенному случаю: несколько групп, частичная раскатка и необходимость отделить влияние релиза от общего шума.

https://habr.com/ru/articles/986182/

#diffindiff #синтетический_контроль #synthetic_control #продуктовая_аналитика #причинный_анализ #causalimpact #оценка_эффекта #плацебо_проверки

#плацебо_проверки #оценка_эффекта #causalimpact #причинный_анализ #продуктовая_аналитика #synthetic_control

Habr @[email protected] · 2026-01-17 · 18:42 UTC

Оценка эффекта релиза, когда изменение затронуло не всех: diff-in-diff и синтетический контроль

Когда релиз раскатан не на всех, классическая схема "до" и "после" начинает рушиться: метрика растет или падает одновременно из-за сезонности, внешнего фона и изменений в каналах, а не только из-за продукта. При этом AB теста может не быть, но данные по группам есть почти всегда: по гео, сегментам, кластерам, витринам. В этой статье разбираю два практических подхода, которые позволяют оценить эффект релиза в таких условиях. Первый - diff-in-diff: сравниваем, насколько изменилась метрика в затронутой группе относительно контрольной, и тем самым вычитаем общий фон, который влияет на всех. Второй - синтетический контроль: строим базовую линию для затронутой группы как сумму метрик нескольких контрольных групп с весами, подобранными так, чтобы до релиза эта конструкция максимально повторяла историю затронутой группы. Отдельный акцент на том, что обычно искажает выводы: заметный рост или падение разницы между группами до релиза, изменения состава, локальные акции или технические инциденты в контрольных группах, а также ситуации, когда базовая линия плохо повторяет период до релиза и тогда мы измеряем в основном ошибку модели, а не эффект релиза. В конце показываю, какие проверки стоит сделать, чтобы результат не держался на удачно выбранных границах периода или на одной контрольной группе. Если в первой части мы работали с одной временной линией метрики, то здесь переходим к более распространенному случаю: несколько групп, частичная раскатка и необходимость отделить влияние релиза от общего шума.

https://habr.com/ru/articles/986182/

#diffindiff #синтетический_контроль #synthetic_control #продуктовая_аналитика #причинный_анализ #causalimpact #оценка_эффекта #плацебо_проверки

#плацебо_проверки #оценка_эффекта #causalimpact #причинный_анализ #продуктовая_аналитика #synthetic_control

Habr @[email protected] · 2026-01-17 · 18:42 UTC

Оценка эффекта релиза, когда изменение затронуло не всех: diff-in-diff и синтетический контроль

Когда релиз раскатан не на всех, классическая схема "до" и "после" начинает рушиться: метрика растет или падает одновременно из-за сезонности, внешнего фона и изменений в каналах, а не только из-за продукта. При этом AB теста может не быть, но данные по группам есть почти всегда: по гео, сегментам, кластерам, витринам. В этой статье разбираю два практических подхода, которые позволяют оценить эффект релиза в таких условиях. Первый - diff-in-diff: сравниваем, насколько изменилась метрика в затронутой группе относительно контрольной, и тем самым вычитаем общий фон, который влияет на всех. Второй - синтетический контроль: строим базовую линию для затронутой группы как сумму метрик нескольких контрольных групп с весами, подобранными так, чтобы до релиза эта конструкция максимально повторяла историю затронутой группы. Отдельный акцент на том, что обычно искажает выводы: заметный рост или падение разницы между группами до релиза, изменения состава, локальные акции или технические инциденты в контрольных группах, а также ситуации, когда базовая линия плохо повторяет период до релиза и тогда мы измеряем в основном ошибку модели, а не эффект релиза. В конце показываю, какие проверки стоит сделать, чтобы результат не держался на удачно выбранных границах периода или на одной контрольной группе. Если в первой части мы работали с одной временной линией метрики, то здесь переходим к более распространенному случаю: несколько групп, частичная раскатка и необходимость отделить влияние релиза от общего шума.

https://habr.com/ru/articles/986182/

#diffindiff #синтетический_контроль #synthetic_control #продуктовая_аналитика #причинный_анализ #causalimpact #оценка_эффекта #плацебо_проверки

#diffindiff #синтетический_контроль #synthetic_control #продуктовая_аналитика #причинный_анализ #causalimpact

Habr @[email protected] · 2024-12-18 · 14:12 UTC

Diff-in-diff: жизнь за пределами идеального эксперимента

Привет, Хабр! На связи команда ad-hoc аналитики X5 Tech. Основная задача аналитика при проведении А/Б тестирования - оценка эффекта воздействия (тритмента). В этой статье мы обсудим, что такое идеальный эксперимент и почему он позволяет корректно оценить эффект от воздействия. Затем расскажем, когда идеальный эксперимент невозможен и дадим интуитивное обоснование того, как метод difference-in-difference помогает справиться с оценкой эффекта воздействия в таких ситуациях. В конце мы обсудим формальные предпосылки метода и покажем на примере симуляций последствия их невыполнения.

https://habr.com/ru/companies/X5Tech/articles/867734/

#статистика #эконометрика #causal_inference #differenceindifference #diffindiff #абтесты #эксперимент #линейная_регрессия #абтестирование #treatment

#статистика #эконометрика #causal_inference #differenceindifference #diffindiff #абтесты

Habr @[email protected] · 2024-12-18 · 14:12 UTC

Diff-in-diff: жизнь за пределами идеального эксперимента

Привет, Хабр! На связи команда ad-hoc аналитики X5 Tech. Основная задача аналитика при проведении А/Б тестирования - оценка эффекта воздействия (тритмента). В этой статье мы обсудим, что такое идеальный эксперимент и почему он позволяет корректно оценить эффект от воздействия. Затем расскажем, когда идеальный эксперимент невозможен и дадим интуитивное обоснование того, как метод difference-in-difference помогает справиться с оценкой эффекта воздействия в таких ситуациях. В конце мы обсудим формальные предпосылки метода и покажем на примере симуляций последствия их невыполнения.

https://habr.com/ru/companies/X5Tech/articles/867734/

#статистика #эконометрика #causal_inference #differenceindifference #diffindiff #абтесты #эксперимент #линейная_регрессия #абтестирование #treatment

#статистика #эконометрика #causal_inference #differenceindifference #diffindiff #абтесты

Habr @[email protected] · 2024-12-18 · 14:12 UTC

Diff-in-diff: жизнь за пределами идеального эксперимента

Привет, Хабр! На связи команда ad-hoc аналитики X5 Tech. Основная задача аналитика при проведении А/Б тестирования - оценка эффекта воздействия (тритмента). В этой статье мы обсудим, что такое идеальный эксперимент и почему он позволяет корректно оценить эффект от воздействия. Затем расскажем, когда идеальный эксперимент невозможен и дадим интуитивное обоснование того, как метод difference-in-difference помогает справиться с оценкой эффекта воздействия в таких ситуациях. В конце мы обсудим формальные предпосылки метода и покажем на примере симуляций последствия их невыполнения.

https://habr.com/ru/companies/X5Tech/articles/867734/

#статистика #эконометрика #causal_inference #differenceindifference #diffindiff #абтесты #эксперимент #линейная_регрессия #абтестирование #treatment

#статистика #эконометрика #causal_inference #differenceindifference #diffindiff #абтесты

Habr @[email protected] · 2024-12-18 · 14:12 UTC

Diff-in-diff: жизнь за пределами идеального эксперимента

Привет, Хабр! На связи команда ad-hoc аналитики X5 Tech. Основная задача аналитика при проведении А/Б тестирования - оценка эффекта воздействия (тритмента). В этой статье мы обсудим, что такое идеальный эксперимент и почему он позволяет корректно оценить эффект от воздействия. Затем расскажем, когда идеальный эксперимент невозможен и дадим интуитивное обоснование того, как метод difference-in-difference помогает справиться с оценкой эффекта воздействия в таких ситуациях. В конце мы обсудим формальные предпосылки метода и покажем на примере симуляций последствия их невыполнения.

https://habr.com/ru/companies/X5Tech/articles/867734/

#статистика #эконометрика #causal_inference #differenceindifference #diffindiff #абтесты #эксперимент #линейная_регрессия #абтестирование #treatment

#treatment #абтестирование #линейная_регрессия #эксперимент #абтесты #diffindiff

Stas Kolenikov @[email protected] · 2023-02-06 · 14:29 UTC

Workshop on #diffindiff #DID difference-in-differences from U of Michigan Population Dynamics and Health Program by @pedrohcgs (yeah he may want to establish a better Mastodon presence) -- https://pdhp.isr.umich.edu/workshops/difference-in-differences/ #causalinference #econtwitter #publichealth Materials in #rstats #Stata

#stata #rstats #publichealth #econtwitter #causalinference #did

Stas Kolenikov @[email protected] · 2023-02-06 · 14:29 UTC

Workshop on #diffindiff #DID difference-in-differences from U of Michigan Population Dynamics and Health Program by @pedrohcgs (yeah he may want to establish a better Mastodon presence) -- https://pdhp.isr.umich.edu/workshops/difference-in-differences/ #causalinference #econtwitter #publichealth Materials in #rstats #Stata

#stata #rstats #publichealth #econtwitter #causalinference #did

Stas Kolenikov @[email protected] · 2023-02-06 · 14:29 UTC

Workshop on #diffindiff #DID difference-in-differences from U of Michigan Population Dynamics and Health Program by @pedrohcgs (yeah he may want to establish a better Mastodon presence) -- https://pdhp.isr.umich.edu/workshops/difference-in-differences/ #causalinference #econtwitter #publichealth Materials in #rstats #Stata

#stata #rstats #publichealth #econtwitter #causalinference #did

Stas Kolenikov @[email protected] · 2023-02-06 · 14:29 UTC

Workshop on #diffindiff #DID difference-in-differences from U of Michigan Population Dynamics and Health Program by @pedrohcgs (yeah he may want to establish a better Mastodon presence) -- https://pdhp.isr.umich.edu/workshops/difference-in-differences/ #causalinference #econtwitter #publichealth Materials in #rstats #Stata

#diffindiff #did #causalinference #econtwitter #publichealth #rstats

Stas Kolenikov @[email protected] · 2023-02-06 · 14:29 UTC

Workshop on #diffindiff #DID difference-in-differences from U of Michigan Population Dynamics and Health Program by @pedrohcgs (yeah he may want to establish a better Mastodon presence) -- https://pdhp.isr.umich.edu/workshops/difference-in-differences/ #causalinference #econtwitter #publichealth Materials in #rstats #Stata

#stata #rstats #publichealth #econtwitter #causalinference #did

Stas Kolenikov @[email protected] · 2023-01-12 · 01:13 UTC

#ICHPS2023 @[email protected] here’s our quick check of the parallel lines assumption of DID #CausalInference #DiffInDiff

#diffindiff #causalinference #ichps2023

Stas Kolenikov @[email protected] · 2023-01-12 · 01:13 UTC

#ICHPS2023 @[email protected] here’s our quick check of the parallel lines assumption of DID #CausalInference #DiffInDiff

#diffindiff #causalinference #ichps2023

Stas Kolenikov @[email protected] · 2023-01-12 · 01:13 UTC

#ICHPS2023 @[email protected] here’s our quick check of the parallel lines assumption of DID #CausalInference #DiffInDiff

#diffindiff #causalinference #ichps2023

Stas Kolenikov @[email protected] · 2023-01-12 · 01:13 UTC

#ICHPS2023 @[email protected] here’s our quick check of the parallel lines assumption of DID #CausalInference #DiffInDiff

#ichps2023 #causalinference #diffindiff

Fabio I. Martinenghi @[email protected] · 2022-11-08 · 19:42 UTC

@marcfbellemare @WeinbergEcon @paulgp @johnholbein @khoavuumn

Poor SCM... Too data driven? My understanding is that it outperforms/complements #diffindiff in some settings. Thanks for the recommendations!

#diffindiff

Fabio I. Martinenghi @[email protected] · 2022-11-08 · 19:42 UTC

@marcfbellemare @WeinbergEcon @paulgp @johnholbein @khoavuumn

Poor SCM... Too data driven? My understanding is that it outperforms/complements #diffindiff in some settings. Thanks for the recommendations!

#diffindiff

Fabio I. Martinenghi @[email protected] · 2022-11-08 · 19:42 UTC

@marcfbellemare @WeinbergEcon @paulgp @johnholbein @khoavuumn

Poor SCM... Too data driven? My understanding is that it outperforms/complements #diffindiff in some settings. Thanks for the recommendations!

#diffindiff

Fabio I. Martinenghi @[email protected] · 2022-11-08 · 19:42 UTC

@marcfbellemare @WeinbergEcon @paulgp @johnholbein @khoavuumn

Poor SCM... Too data driven? My understanding is that it outperforms/complements #diffindiff in some settings. Thanks for the recommendations!

#diffindiff