журнал стратегия

#журнал стратегия

Слишком много данных

Data Scientist – одна из самых востребованных профессий, где брать специалистов?

Основатель Dodo Pizza Федор Овчинников часто хвалится, что его компания — не просто сеть пиццерий, а настоящий IT-бизнес. Оцифровано большинство процессов — от добавки ингредиентов и работы кухни до доставки, что позволяет отслеживать работу ресторанов в режиме реального времени. Сейчас Dodo Pizza решила сделать следующий шаг и набирает команду специалистов по Data Science (дословный перевод — «наука о данных»). Зачем? Компания хранит огромное количество данных о конкретных заказах: география, частота, время, что чаще заказывают. Проанализировав их, в Dodo Pizza надеются сначала создать рекомендательную систему, а затем улучшить логистику курьеров, делать персональные предложения, внедрить разные уровни лояльности и другие полезные для бизнеса вещи.

То, чем планирует заниматься Dodo Pizza, актуально для компаний из разных сфер по всему миру. Понятие «большие данные», появившись все 10 лет назад, стало одним из самых важных в бизнесе, государственном управлении, медицине. Спектр применения очень широк. Анализируя большие массивы информации, можно лучше узнать клиента и повысить продажи — в команде торговой сети Walmart, например, больше 100 специалистов по работе с большими данными, там вычисляют даже такие инсайты, как влияние погоды на продажи йогуртов или шоколада в разных городах США, что позволяет точнее планировать акции и управлять ассортиментом. Промышленники повышают эффективность производства — Магнитогорский металлургический комбинат, например, предварительно оценивал экономический эффект от пяти проектов в сфере big data, реализованных в 2018 году, в 40 млн рублей ежегодно. Но есть проблема — нужны специалисты. Где их искать и сколько они стоят?

Еще в 2012 году журнал Harvard Business Review назвал профессию Data Scientist — человека, который анализирует большие данные — «самой сексуальной профессией XXI века». Один из авторов этой статьи позже стал главным Data Scientist в Белом доме США. Похоже, предсказания сбылись. Аналитическое агентство Glassdoor уже третий год подряд называет Data Scientist лучшей работой в США, в среднем специалисты по аналитике больших данных получают $110 000 в год.

В России специалист по Data Science получает меньше. По данным сайта HeadHunter, на конец ноября 2018 года в России активны были 324 вакансии Data Scientist. Больше всего специалистов ищут в Москве (199 вакансий), Санкт-Петербурге (58) и Новосибирской области (14). Сразу несколько компаний готовы платить до 250 000-350 000 рублей в месяц. А Boston Consulting Group и вовсе обещает Senior Data Scientist зарплату до $7000.

Строго говоря, для работы с большими данными нужны два вида специалистов — Data Scientist и Data Engineer. Чем они отличаются? Data Scientist занимается аналитикой данных, поэтому он должен быть больше математиком, нежели программистом. Data Engineer отвечает непосредственно за сбор больших данных. Они могут быть не только структурированными: данные можно получить из интернет-трафика, звуковых и видеофайлов, изображений и так далее. Data Engineer должен найти нужные данные, придумать, как их собрать, потом очистить их и представить в удобном для анализа виде. Этот специалист — скорее программист, нежели математик. Зачастую нет строго разделения на Data Engineer и Data Scientist, они могут быть взаимозаменяемы. К тому же, судя по сайту HeadHunter, уровень зарплаты у Data Engineer топ-уровня сравним с Data Scientist.

В конце 2017 года компания JetBrains, создающая продукты для разработчиков, провела исследование российских специалистов по Data Science, опросив почти 400 человек. Оказалось, что возраст 57% опрошенных — от 21 до 29 лет, 35% — от 30 до 39 лет. Почти половина опрошенных имеют опыт лишь от одного до трех лет. При этом опыт более 6 лет имеют только 7%, что еще раз доказывает молодость этой специальности. Возраст основной массы специалистов в России, по данным JetBrains, совпадает с мировыми показателями. А вот с образованием есть большие различия. В мире 36% опрошенных специалистов имеют степень магистра, а 45% — степень бакалавра. В России эти же показатели — 20% и 59%. Таким образом, среди респондентов уровень образования ниже, чем в мире, отмечают в JetBrains.

Руководитель департамента Data Science финансового холдинга ID Finance Андрей Атрашкевич считает, что большинство хороших Data Scientists — самоучки. Действительно, существует огромное количество онлайн-курсов, которые помогают освоить эту профессию. Такие курсы есть, например, у MIT, Гарварда и других ведущих американских университетов. Университет Джонса Хопкинса предлагает целых девять курсов по Data Science. Правда, у легкого доступа к обучению есть и обратная сторона. Доступность инструментов создает иллюзию легкости получения образования. В итоге с одной стороны, на рынке труда ощущается дефицит кадров, с другой — он переполнен людьми, которые ничего не умеют, хотя убеждены в обратном.

Получить полноценное образование по специальности Data Science в России вполне возможно. Еще в 2007 году «Яндекс» запустил собственную «Школу анализа данных», также у интернет-компании есть свои кафедры в МФТИ и Высшей школе экономики. Собственная «Школа данных» есть у «Билайна», а Mail.Ru обучает студентов в том числе и по этой специальности в своем «Технопарке» при МГТУ им. Баумана.

Что насчет вузов? В МГУ есть две программы магистратуры по анализу больших данных, в Высшей школе экономики таких программ три.  В Санкт-Петербурге анализу данных учат в ИТМО и СПбГУ, аналогичный курс есть в казанском Иннополисе. У Новосибирского государственного университет есть собственный курс анализа данных на Coursera. «К сожалению, образование — вещь очень консервативная. Сейчас институты, в которых учат анализу данных, можно пересчитать по пальцам одной-двух рук. Остальные не успевают за этим трендом. Не хватает преподавателей-практиков в области анализа данных», — говорил в интервью изданию «Кот Шредингера» заведующий лабораторий машинного интеллекта МФТИ Константин Воронцов.

Сколько стоит стать Data Scientist? Почти во всех вузах есть возможность попасть на бюджетные места. В «Школе анализа данных» Яндекса один семестр обойдется в 120 000 рублей, но отличникам обещают бесплатное обучение после второго семестра. В «Школе данных» «Билайна» курс из 28 занятий стоит 100 000 рублей. Но надо учитывать, что для полноценного овладения профессией потребуются, как минимум, знание программирования, высшей математики, статистики, теории вероятности.

Кадровый голод

В марте 2018 года, выступая на конференции «Россия – страна возможностей» глава Сбербанка Герман Греф целый час рассказывал о технологических трендах. Один из них – большие данные и нехватка специалистов для работы с ними. «Охота за специалистами в области больших данных, машинного обучения, искусственного интеллекта превращается в тотальную. И это привело к резкому росту заработных плат. Сегодня это специалисты, заработные платы которых исчисляются пяти-шестизначными цифрами», – рассказывал Греф. По его словам, мало того, что квалифицированных кадров не хватает, так еще и наблюдается их отток.

Впрочем, высококвалифицированных Data Scientist не хватает во всем мире. В 2015 году аналитики из McKinsey предсказывали, что в 2018 году только в США нужно будет 490 000 специалистов по Data Science, но их будет лишь 200 000, а по всему миру количества специалистов не будет хватать, чтобы закрыть 50% спроса. Прогноз почти сбылся. В августе 2018 года соцсеть LinkedIn насчитала у себя почти 152 000 профилей людей, которые указали, что владеют навыками Data Science.

К сожалению, в России, если ситуация с образованием не изменится, дефицит специалистов будет только расти. Согласно исследованию Фонд развития интернет-инициатив, в 2027 году в России не будет хватать около 2 млн IT-специалистов. В своем отчете представители фонда говорят, что, начиная с 2018 года, нужно набирать дополнительно не менее 40 000 человек каждый год при одновременном повышении качества обучения и целевого трудоустройства выпускников. Но есть и хорошие новости. Если вы специалист в области Data Science, то вы точно сможете найти себе работу.

Дмитрий Запаснов

Фото: Shutterstock.com

анонсы
мероприятий
инновации

НАСА обвинило Китай в прикрытии своего военного присутствия в космосе гражданскими проектами

 

#, ,
инновации

Google со временем вложит более $100 млрд в разработку ИИ-технологий

 

#, , , ,