Приметы XXI века: как работает сервис «Яндекс.Погода»

Искусственный интеллект учится предсказывать погоду.
Приметы XXI века: как работает сервис «Яндекс.Погода»

Сегодня в мире действует больше 10 000 метеостанций и 1500 радаров, собираются данные с высотных атмосферных зондов и более чем 80 метеоспутников, работающих на орбите. Но главными предсказателями погоды выступают наши знания о физике протекающих в атмосфере процессов. Их обобщают сложные математические модели — такие, как система WRF (Weather Research and Forecasting), которую развивает американский Национальный центр исследований атмосферы, или GFS (Global Forecast System) Национального управления океанических и атмосферных исследований. Существует несколько десятков таких программ, позволяющих моделировать состояние атмосферы на основе собранных метеоданных. По большому счету, термометры и другие инструменты нужны им лишь для того, чтобы сверять и корректировать начальные и граничные условия и результаты своих расчетов. Расчетов всегда приблизительных, но все равно исключительно трудных.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Добиваясь все большего разрешения, вплоть до километра, эти модели становятся все требовательнее к вычислительным ресурсам. Если взглянуть на список самых мощных суперкомпьютеров, в нем обязательно будет несколько машин, связанных с моделированием ядерных взрывов, поведения плазмы — и погоды. «Так накапливается большой архив данных по предсказаниям разных моделей, и в них можно поискать тонкие различия между сделанными прогнозами, — говорит метеоролог Дмитрий Соломенцев. — Это как раз тот момент, когда в игру вступает машинное обучение. Машинный интеллект легко обнаруживает закономерности, ускользающие от нашего взгляда, и позволяет уточнить применимость разных моделей. Скажем, он замечает, что если показания давления у нас такие-то, то лучше применить такую-то модель, слегка понизив температуру, которую она дает в результате, и это будет самый точный прогноз. Подобных нюансов система находит очень много».

Приметы, которые не работают

Жизнь человека всегда зависела от погоды, и «народная мудрость» накопила сотни примет, позволяющих предсказывать ее на несколько часов, а иногда и месяцев вперед. И если зависимость «помыть машину – всегда к дождю» проверить непросто, то многие другие приметы вполне поддаются статистике. «На Самсона дождь – семь недель то ж» легко перевести на формальный язык: «Если 27 июня идет дождь, то осадков между 28 июня и 15 августа больше среднего» – и проверить справедливость этого утверждения по данным многолетних архивов. Отобрав дюжину таких примет, в «Яндексе» испытали их метеорологической статистикой и выяснили: они не работают. Бóльшая часть вообще сбывается меньше чем в половине случаев, так что понимать их лучше с точностью до наоборот.

Обсуждение применения искусственного интеллекта для предсказаний погоды ведется уже много лет. В январе 2016 года корпорация IBM приобрела одного из крупнейших поставщиков метеоуслуг — компанию The Weather, намереваясь объединить ее огромный архив данных с мощью своей системы искусственного интеллекта Watson. Но еще за полгода до них свою технологию «Метеум» представила команда Дмитрия Соломенцева: сегодня прогнозы сервиса «Яндекс.Погода» создаются с учетом рекомендаций, которые выдает технология машинного обучения MatrixNet. «Если мы зайдем сейчас посмотреть погоду, система получит наши координаты, возьмет прогнозы разных моделей (которые обновляются четыре раза в сутки), выберет самый подходящий, пересчитает и выдаст ответ в режиме реального времени», — объясняет Дмитрий Соломенцев.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

В стремлении дать как можно более точное предсказание в ход идет все, даже рельеф местности, который выясняется исходя из GPS-координат нужной точки. Еще большее улучшение прогнозов могут принести новые — и очень обширные — источники информации: бытовые электронные метеостанции и смартфоны, многие модели которых оснащены как минимум барометром. Это очень «грязные» и шумные данные, они собираются без строгого контроля условий, но их так много, что неточности компенсируются, и они могут стать весьма полезны. Впрочем, каким бы изощренным методом мы ни пользовались, он обязательно упрется в фундаментальный предел предсказуемости самой погоды.

Приметы нового века

Архивы погоды – обычная игрушка программистов, осваивающих работу с «большими данными». Этой информации действительно много, доступ к ней открыт, и при желании здесь можно найти самые неожиданные зависимости, случайные и не очень. Например, для каждой народной приметы – альтернативную дату, в которую она статистически чаще сбывается. Существование таких корреляций – игра случая. Никакой научно обоснованной связи между погодой, например, 12 сентября («достоверный» вариант «Аксиньи Весноуказательницы») и следующей весной нет. Доверчивый мозг легко принимает такие совпадения за причинно-следственную связь, будь то статистическая примета или «настоящая», народная.

«Это как "эффект бабочки", — объясняет Дмитрий Соломенцев, — погода примерно через десять дней уже слишком сильно зависит от нюансов той погоды, которая стоит сейчас. Малейшее изменение может вызвать яркий эффект дни спустя». При этом мы не получаем и в обозримом будущем не будем получать достаточно полные глобальные данные о текущем состоянии погоды, чтобы учитывать всё до последней детали. Поэтому до сих пор — несмотря на использование суперкомпьютеров и искусственного интеллекта — даже лучшие погодные сервисы дают прогноз на сутки вперед с точностью примерно до 1,7 градуса, а к десяти дням вперед расхождение может достигать и пяти. Точность предсказаний на две недели вперед уже не превышает климатических показателей, усредненных за много лет. В этой области еще долго останется к чему приложить интеллект, в том числе и естественный.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Это даже обидно: мы можем рассчитать полет дальнего космического зонда на миллиарды километров и на годы вперед, и при этом неспособны предсказать, будет ли облачно через две недели.

Дмитрий Соломенцев, руководитель группы метеопрогнозирования «Яндекса»: «Что является результатом обучения нашего искусственного интеллекта? Набор правил. Например, "если надвигается циклон, а такая-то модель предсказывает высокий уровень конвективной энергии, то должен быть дождь". По сути, это новая форма тех же примет».