Дата-исследование · Общество

Интерактивная карта обстрелов России. Обновление в реальном времени

Военные действия затронули не менее 60 регионов страны

Алеся Соколова, дата-журналистка «Новой газеты Европа», исследовательница Cedar
Ксения Сторожева, специально для «Новой газеты Европа»

Коллаж: «Новая Газета Европа»

С каждым годом война распространяется по России — число атак беспилотников растет, дроны и ракеты долетают до все большего числа регионов. «Новая-Европа» составила карту военных инцидентов на территории страны с 2022 года. Она обновляется каждые 15 минут и ее можно использовать, чтобы следить за атаками в реальном времени. 

ЗДЕСЬ ДОЛЖЕН БЫТЬ ИНТЕРЕСНЫЙ ГРАФИК

Из-за необходимости обходить блокировки мы не всегда можем встроить графики. Но в полной версии сайта вы увидите материал так, как мы его и задумывали!

Открыть полную версию материала

Не забудьте включить VPN, если вы в России

Наш алгоритм собирает посты из более 700 телеграм-каналов и выделяет из них военные атаки с помощью искусственного интеллекта. Большинство атак — со стороны Украины, однако на карту попадают и другие события: например, случайные удары России по своей территории. 

Одно событие на карте состоит из как минимум двух новостей об одном и том же действии (например, атаке беспилотников), написанных с разницей не больше суток, где указано одно и то же место происшествия. Подробнее про нашу методологию читайте в скрытом блоке ниже.

Цель нашей карты — дать общую картину военных инцидентов на территории России. Достичь стопроцентной точности при этом невозможно: искусственный интеллект иногда ошибается (ошибки встречаются в ~5% описаний и локаций), и мы не можем гарантировать достоверность всего, что пишут в новостях. Кроме того, на нашей карте встречаются дубли событий — их там также около 5%. 

Мы рекомендуем самостоятельно верифицировать информацию, которую вы найдете на карте. Сообщить об ошибке можно по кнопке внутри карточки инцидента.

Видеоверсия материала «Новой-Европа» 

Главные выводы:

Если описывать схематично, наш алгоритм работает так: - Мы непрерывно выгружаем из телеграма новости из более чем 700 телеграм-каналов, включая оппозиционные, провластные и региональные медиа России, а также каналы губернаторов и госструктур и украинские медиа.  - Каждый пост проверяется искусственным интеллектом, и если он описывает военный инцидент, то ИИ извлекает из него тип инцидента и место происшествия. - Посты об одних и тех же действиях, произошедших в одном месте, группируются и считаются одним событием.  Военные инциденты отбираются с помощью языковой модели. На первом этапе модель определяет, описывает ли сообщение конкретное произошедшее военное событие на территории России или аннексированного Крыма (другие оккупированные территории мы не включали). К военным инцидентам относятся только фактические боевые действия (атаки БПЛА с попаданием в цель, ракетные удары, перехваты средствами ПВО, артиллерийские обстрелы, воздушные удары, наземные операции, военно-морские атаки), при этом исключаются воздушные тревоги без последствий, предупреждения об угрозах и так далее.  На втором этапе с помощью той же языковой модели мы извлекаем структурированную информацию: конкретное место происшествия, регион, категорию и краткое описание. Если в одном сообщении упоминается несколько локаций или типов атак, они выделяются в отдельные события.  Мы учитываем настолько точную локацию, насколько это возможно из контекста новости. Например, если в новостях указан только город, все посты об атаках беспилотников в этом городе в этот день будут считаться одной атакой, а если в новостях писали о прилетах в конкретные районы города, такие точки отметятся на карте отдельно.  Потом модель проверяет каждое выделенное событие на корректность: модель подтверждает, что категория военного инцидента и регион действительно упоминаются в исходном тексте, и определяет давность события.  Отбрасываются события, произошедшие более одного дня назад от момента публикации поста. Мы проверяли посты на этот критерий путем проверки наличия определенных ключевых слов («неделю назад», «месяц назад» и т. д.), а также с помощью той же языковой модели Gemini.  После выделения постов о военных инцидентах с помощью отдельного алгоритма дедупликации мы объединяем посты об одних и тех же событиях. Посты считаются описывающими одно событие, если совпадают тип военного действия и локация, а временная разница между публикациями не превышает 24 часов.  Если у обоих постов указана локация, проверяется их близость на карте с помощью API Google Maps (локация считается одной и той же, если между точками меньше трех километров), а также похожесть названий локаций (если они звучат похоже, например, «Шебекино» и «Щебекино», мы считаем, что имелось в виду одно место, даже если API Google Maps геолоцировал в разные точки).  Если у какого-то события локация не указана, а указан только регион, то мы проверяем эмбеддинги описаний событий — векторные представления текстов, созданные с помощью API OpenAI. Если они близки, то мы считаем, что тексты описывают одно и то же событие. Несмотря на сложный алгоритм объединения событий и удаления дублей, нам не удалось полностью от них избавиться. Мы проверили количество дублей военных событий одной недели в октября 2024-го и 2025-го года, а также в январе 2026. Суммарно за эти даты модель выделила 806 событий после алгоритма дедупликации. При ручной проверке оказалось, что из них 95% были реальными уникальными событиями, а не дублями других событий. Также мы заметили, что около 5% событий содержат ошибки в описании или локации — от них полностью избавиться тоже не удалось.