Представители Банка России объявили, что будут использовать «машинное обучение» и массивы данных (Big Data) для анализа публикаций в интернете, чтобы оперативно исследовать состояние российской экономики и реагировать на ее изменения.
В ЦБ проанализируют не только новости, но и сайты интернет-магазинов, и сайты по поиску работы, и социальные сети, и блоги. Информация из различных интернет-источников более многообразная и оперативная, что, по мнению специалистов ЦБ, позволит разработать экономические показатели более точные, чем официальная статистика. Авторы методики намерены создать целую линейку индексов с использованием Big Data — индекс экономической активности, опережающий показатель по рынку труда, индекс ценового давления и другие индексы, говорится в сообщении регулятора. Оцениваться будет даже настроение журналистов и героев публикаций.
С января 2014 года по август 2017 года специалисты Банка России уже изучили около 50 тысяч ежедневных новостей. Для анализа было выбрано 50 ключевых тем, среди которых валютный курс, нефть, банковский сектор и ситуация в США. Исследователи определяли позитивную или негативную тональность новостей, говорится в сообщении Банка России.
На основе полученных данных аналитики построили индикатор, который смог довольно точно предсказать движение индекса деловой активности, описывающего ситуацию в разных отраслях экономики. Новая методика обгоняет официальную статистику: например, данные о росте валового внутреннего продукта (ВВП) публикуются раз в квартал с задержкой в 1–1,5 месяца после его окончания — с такой скоростью невозможно быстро и эффективно отреагировать на изменения в экономике.
Фото: Артур Салимов