Машинное обучение что это такое урок цифры

Урок цифры «Искусственный интеллект и машинное обучение»

Урок цифры «Искусственный интеллект и машинное обучение»На уроке участники пройдут все этапы создания алгоритмов искусственного интеллекта на примере беспилотного автомобиля и больше узнают про профессию Data Scientist. Урок можно пройти самостоятельно.

Другие направления

Машинное обучение что это такое урок цифры

Машинное обучение что это такое урок цифры

Машинное обучение что это такое урок цифры

Рекомендуем

Машинное обучение что это такое урок цифры

Онлайн курс по машинному обучению

Машинное обучение что это такое урок цифры

Вводные уроки по машинному обучению (МО)

Машинное обучение что это такое урок цифры

Вводные уроки по Python

Машинное обучение что это такое урок цифры

Вводные уроки по искусственному интеллекту (ИИ)

Вместе с экспертом отвечаем на вопрос, чему учиться взрослому, чтобы быть востребованным специалистом, и чему учить команды, чтобы оставаться востребованным бизнесом?

Об эксперте: Надежда Макова, CEO EdTech-платформы для развития бизнес команд K-AMPUS и просветительского медиа «Теории и практики».

Рынок труда как в России, так и во всем мире переживает постпандемийный кризис. В сентябре 2021 года, исходя из данных международного исследования Future of Work, 58% работодателей заявили, что поиск кандидатов с нужными навыками в пандемию стал их самой большой проблемой. Сегодня, по результатам исследования Hays, 76% работодателей не могут найти квалифицированных специалистов, 69% из-за этого готовы принимать на работу сотрудников не только из других регионов, но и из других отраслей. В то же время 56% опрошенных планируют в ближайшее время менять работу.

Борьба за таланты обостряется: бизнес пытается привлечь кандидатов перспективами карьерного роста (58%), а соискателей интересуют в первую очередь интересный функционал и возможности для развития (69%). Все это происходит в условиях, когда навыки устаревают с невероятной скоростью: в ближайшие месяцы каждый третий навык, необходимый для работы в 2018 году, окажется ненужным, а 85% профессий, которые возникнут в 2030 году, сегодня еще не изобретены.

«Квантовый мир: как устроен квантовый компьютер»

Задание 1. Принцип неопределённости Гейзенберга

Машинное обучение что это такое урок цифры

Машинное обучение что это такое урок цифры

Для перехода к следующему заданию все карточки должны быть перевернуты.

Задание 2. Языки и науки.

Машинное обучение что это такое урок цифры

Криптография – Методы создания паролей и шифров, обеспечение конфиденциальности

Фармацевтика – Производство лекарственных средств и лекарственных веществ и проведение клинических испытаний

Компьютерное моделирование – Создание модели на компьютере приближенной к реальному объекту, например, создание модели автомобиля для проведения экспериментов

Машинное обучение – Создание моделей и алгоритмов, направленных на улучшения способностей компьютера

Симуляция процессов – Воспроизведение на компьютере процесса, который сложно показать в реальном мире. Например, прогнозирование погоды

Криптография, фармацевтика, машинное обучение и компьютерное моделирование сейчас являются наиболее развивающимися областями науки.

Задание 3. Задачи для квантового компьютера.

Машинное обучение что это такое урок цифры

  • Работа с паролями и шифрами
  • Создание новых соединений молекул для производства лекарств
  • Моделирование клиентского поведения

Задание 4. Будущее рядом.

Машинное обучение что это такое урок цифры

Уже используют квантовые технологии:

  • флешки;
  • оптоволоконная связь;
  • персональные компьютеры.

Будут использовать квантовые технологии:

  • Логистика доставки продуктов;
  • Приватность информации в месенджерах;
  • Улучшение системы рекомендации видео в социальных сетях.

Задание 5. Принципы работы квантового компьютера.

Машинное обучение что это такое урок цифры

Верные ответы:
1. Квантовый компьютер в качестве носителей информации использует квантовые объекты, для проведения вычислений они должны быть соединены в квантовую систему. Для операций над кубитами используется система операций, называемая квантовыми вентилями. Существуют универсальные наборы вентилей, с помощью которых можно выполнить любое квантовое вычисление. Для получения результата работы квантового компьютера надо многократно запустить квантовый алгоритм на одном и том же входном наборе данных и усреднить результат.

Машинное обучение что это такое урок цифры

С 26 сентября по 16 октября в школах по всей стране будет проходить «Урок цифры» по искусственному интеллекту в стартапах. Стратегический партнер и разработчик его содержания – Благотворительный фонд Сбербанка «Вклад в будущее» при экспертной поддержке Сбера. Мероприятие ежегодно проводится АНО «Цифровая экономика», Минцифры России и Минпросвещения России.

«В условиях активной цифровой трансформации государство делает серьезную ставку на цифровые кадры и создает для детей возможность с раннего возраста начинать знакомиться с миром ИТ. Получаемые навыки помогут им не только освоить престижную и высокооплачиваемую профессию, но и развить креативность, логическое мышление и коммуникативные навыки. Одновременно с этим скоро стартует образовательный проект Минцифры «Код будущего». Школьники со всей страны смогут бесплатно пройти двухлетние ИТ-курсы и освоить современные языки программирования», – прокомментировал замглавы Минцифры России Николай Яцеленко.

«Урок цифры» призван привлечь внимание детей к сфере искусственного интеллекта (ИИ), предоставить им возможность реализовать свои идеи, продемонстрировать, какие задачи может решать искусственный интеллект посредством технологий компьютерного зрения, обработки естественного языка и аналитики больших данных.

«Мир цифровых технологий увлекает ребят всех возрастов, поэтому особенно важно, что «Урок цифры» как просветительский проект подходит школьникам с 1 по 11 класс. Все учебные материалы имеют свой уровень сложности в зависимости от полученных навыков. Развитие цифровых компетенций становится неотъемлемой частью учебного процесса, позволяет сделать занятия более увлекательными и даже задуматься сегодняшним школьникам о будущей траектории профессионального развития», — сообщил директор Департамента цифровой трансформации и больших данных Минпросвещения России Андрей Горобец.

В ходе «Урока цифры» дети познакомятся с понятием «технологические стартапы» и на практике узнают об основных этапах их создания. Участники смогут освоить разработанный урок в формате видеолекции, которая построена таким образом, чтобы занятия были доступными и интересными для школьников любого возраста: 1-4 классов, 5-7 классов, 8-11 классов. Для закрепления знаний на практике у ребят будет возможность пройти игровой тренажер. Специальная мобильная версия разработана для выполнения заданий дома, потребуется только телефон и доступ к интернету. Материалы урока будут сопровождаться методическими рекомендациями для педагогов по проведению основного варианта урока. Также в них будут предложены альтернативные сценарии проведения занятий с учетом разной технической оснащенности классов.

«Искусственный интеллект – одно из самых динамично развивающихся технологических направлений. Сегодня он уже применяется в любом виде деятельности, а компетенции в сфере ИИ востребованы во всех отраслях, и в будущем их значение будет только возрастать. Проект «Урок цифры» позволяет нам вместе с педагогами по всей стране показывать нашим детям, что ИИ – будущее, в котором знание инструментов анализа данных и машинного обучения – это важное преимущество», – поделился первый заместитель председателя правления Сбербанка Александр Ведяхин.

Для дополнительной подготовки педагогов к «Уроку цифры» 21 сентября на сайте проекта пройдет дистанционное обучающее мероприятие с разработчиками урока. Они помогут педагогам разобраться в методических материалах, больше узнать о технологическом предпринимательстве и передать знания о запуске собственных стартапов школьникам.

«Изучение искусственного интеллекта прочно вошло в нашу повседневную реальность. Эта технология в будущем будет помогать людям решать самые привычные задачи. Включение педагогами урока Благотворителього фонда Сбербанка «Вклад в будущее» в образовательную программу поможет школьникам претворить свои смелые идеи в жизнь, придумать уникальный проект или новый сервис. Учебный материал рассчитан на ребят любого школьного возраста, поэтому станет полезным и нужным инструментом для педагогов, сделает занятия нагляднее и увлекательнее», – отметил врио генерального директора АНО «Цифровая экономика» Дмитрий Тер-Степанов.

«Урок цифры» – ежегодная всероссийская акция, которая проводится в партнерстве с Благотворительным фондом Сбербанка «Вклад в будущее» и Сбером в четвертый раз. В прошлом году в рамках проекта десятки тысяч педагогов воспользовались материалами и провели занятия «Искусственный интеллект в образовании». «Урок цифры» прошли более 3,5 млн раз школьники с 1-го по 11-й класс, педагоги и родители по всему миру. Проект длился 20 дней и охватил Россию и 127 стран мира.

Проект «Урок цифры» реализуется в поддержку федерального проекта «Кадры для цифровой экономики». Занятия на тематических тренажерах проекта проводятся в виде увлекательных онлайн-игр для трех возрастных групп: учащихся младшей, средней и старшей школы. Методические материалы уроков остаются в доступе на сайте проекта и охватывают широкий круг тематик: алгоритмы, кодирование, командная разработка, безопасность в Интернете, управление проектами, искусственный интеллект, машинное обучение, персональные помощники, сети и облачные технологии, большие данные, беспилотный транспорт, нейросети и коммуникации, приватность в цифровом мире.

Инициаторы «Урока цифры» – Министерство просвещения РФ, Министерство цифрового развития, связи и массовых коммуникаций РФ и АНО «Цифровая экономика». Задачами проекта являются развитие у школьников цифровых компетенций и ранняя профориентация: уроки помогают детям сориентироваться в мире профессий, связанных с компьютерными технологиями и программированием. Партнерами проекта в 2021/22 учебном году выступают «Лаборатория Касперского», Благотворительный фонд Сбербанка «Вклад в будущее», фирма «1С», компании Яндекс, VK, Росатом.

Деятельность Благотворительного фонда Сбербанка «Вклад в будущее» нацелена на содействие развитию российского образования с учетом вызовов современного мира и на развитие инклюзивной среды. Программы и проекты фонда создают возможности и условия для развития личностного потенциала каждого, навыков XXI века и новых грамотностей в школах России. Фонд также работает над тем, чтобы в России существовала действенная и жизнеспособная система поддержки эффективных практик, которые помогают детям с опытом сиротства и особенностями развития обрести навыки, необходимые для самостоятельной и достойной жизни.

Машинное обучение что это такое урок цифры

Машинное обучение (machine learning, ML) является самым перспективным направлением искусственного интеллекта. По данным аналитического альманаха МФТИ, одно из главных событий в области искусственного интеллекта в мире в 2021 году – заявление учёных из Стэнфорда о становлении новой парадигмы в области ML: крупные корпорации будут создавать гигантские модели, которые другие компании будут дообучать и использовать для решения своих задач.

Про урокцифры:  СКАНИРОВАНИЕ НЕБЕСНЫХ КАРТ

Что такое машинное обучение?

Machine learning – это область прикладной математики, которая позволяет обучать компьютерные модели для выявления общих закономерностей в данных. Модели машинного обучения на основе большого количества примеров самостоятельно учатся различать полученную информацию и использовать её для решения задач. Machine learning качественным образом отличается от детерминированных алгоритмов, которые включают в себя фиксированный набор предопределённых шагов. Машинное обучение сейчас представляет собой быстро развивающуюся отрасль. Это связано с увеличением вычислительных мощностей и накоплением знаний, появлением совокупности научно обоснованных и эффективных подходов.

Как связаны между собой машинное обучение, нейросети и искусственный интеллект?

Машинное обучение – это область, в которой исследуются и применяются модели, обучающиеся на входных данных. Оно является одним из направлений искусственного интеллекта.

Нейронные сети – одно из семейств моделей машинного обучения.

Искусственный интеллект – группа методов с использованием различных алгоритмов, в том числе на основе машинного обучения, направленных на создание интеллектуальных машин. Сильный искусственный интеллект способен решать повседневные задачи человека, а слабый – выполнять лишь узконаправленные задачи, например, различать разнообразные объекты, объединять в группы похожие изображения. При работе с такими моделями человек передаёт им часть знаний и тем самым ускоряет собственную работу.

Основные направления в machine learning

Для анализа используются размеченные данные, все объекты заранее промаркированы. Например, для обучения модели представлены фотографии с кошками и собаками с соответствующими метками. Задача – научиться различать этих животных.

При обработке массивов информации нет описания или меток объектов, алгоритм должен самостоятельно выявлять закономерности, взаимосвязи и зависимости в данных. Обучение без учителя применяется для поиска похожих текстов, изображений и документов, визуализации и выявления аномалий.

Машина ищет оптимальные действия для выполнения поставленной задачи в различных условиях. Например, модель космического корабля совершает посадку. На основании информации о меняющемся окружении необходимо адаптировать способ действия. Оптимизированные шаги и есть результат обучения.

Какие задачи решает машинное обучение?

Машинное обучение помогает в решении экономических и социально значимых проблем. Основные классы задач, решаемых с помощью machine learning:

Также существуют вспомогательные задачи, которые можно решить с помощью machine learning – распознавание текста на изображениях, детекция символов, идентификация речи и так далее.

Машинное обучение и анализ данных

По мнению доктора физико-математических наук, профессора МФТИ, специалиста в области машинного обучения Константина Воронцова, интеллектуальный анализ данных в целом основывается на подходах и методах машинного обучения. ML занимается построением математических моделей для обобщения информации, а анализ данных как прикладная дисциплина позволяет решать конкретные практические задачи. Модели помогают исследовать и обрабатывать гигантские потоки информации, выявлять закономерности.

В каких сферах применяют machine learning?

Машинное обучение активно используется во многих отраслях экономики. Например, в бизнесе широко применяются модели для предсказания поведения клиентов, создания рекомендательных систем, кластеризации аудитории для настройки показов рекламы (объединение людей в группы по схожим интересам, возрасту или социальному положению). Например, такой метод, как анализ временных рядов, необходим для глубокого понимания происходящих бизнес-процессов, в частности, динамики закупок и продаж товаров, посещаемости сайта и охвата пользователей.

В медицине machine learning помогает анализировать данные различных исследований состояния здоровья пациента. Умные системы на базе ML могут по рентгеновскому снимку выявлять патологии или предсказывать вероятность наличия какого-либо заболевания по совокупности результатов анализов.

В промышленности с помощью моделей машинного обучения внедряется автоматизация технологических процессов. Это позволяет снижать затраты на выпуск продукции и увеличивать производительность.

В сельском хозяйстве с использованием подходов машинного обучения были запущены первые беспилотные комбайны. Автопилот помогает управлять транспортом в то время, когда комбайнёр следит за процессом жатвы.

ML также позволяет обеспечивать безопасность в реальном мире и цифровом пространстве. Например, машинное обучение помогает автоматически вычислять мошеннические транзакции среди многочисленных банковских операций, контролировать заданный периметр и использовать системы биометрического распознавания.

Машинное обучение широко применяется в рамках работы Центра изучения и сетевого мониторинга молодёжи. Цифровое пространство – непрерывно обновляемая среда, которая ежесекундно пополняется полезным, нейтральным и деструктивным контентом. В целях мониторинга и анализа негативных явлений в Интернете специалисты Центра разрабатывают или адаптируют существующие модели машинного обучения. ML значительно упрощает поиск потенциально опасной для пользователей информации среди большого объёма сетевых данных.

Перспективы развития машинного обучения: будет ли искусственный интеллект умнее человека?

Machine learning в перспективе освободит человека от выполнения рутинных операций и сделает его труд более эффективным. Благодаря этому жизнь станет легче, а компьютеры – ещё умнее. Несмотря на большие успехи в области искусственного интеллекта, современное машинное обучение и другие подходы пока не могут заменить человеческий интеллект. Модели занимаются статистическим обобщением свойств объектов, но помимо общих характеристик также существуют особенности, которые можно определить только методом «ручного» анализа. На данный момент это единственная возможность выявлять единичные (уникальные) признаки, распознавать сложные объекты и новые явления во всей их полноте.

У машинного обучения огромные перспективы, капиталовложения в ML постоянно растут. Это те технологии, которые поменяют мир точно так же, как когда-то его изменило изобретение полупроводников или лазера. Сегодня исследовательское сообщество и инженеры стремятся облегчить повседневную жизнь с помощью machine learning и расширить горизонты человеческого знания.

Нейросети и дети: как технологии защищают от цифровых угроз?

В третьей части разберем основной современный метод прогноза LTV — с помощью машинного обучения. Рассмотрим по шагам на примере проекта для United Colors of Benetton и ASOS, как использовать этот продвинутый метод расчета.

В первой части гайда мы разобрали основы — что такое LTV и зачем он нужен, какие индустрии выиграют, если будут анализировать LTV, как рассчитывать метрику с помощью классического валового метода. Во второй части рассмотрели разницу между валовыми методами расчета и историческим LTV, показали формулы для расчета метрики, а также выяснили, как собрать данные и выбирать метод расчета. В третьей части разберем основной современный метод прогноза LTV — с помощью машинного обучения. Рассмотрим по шагам на примере проекта для United Colors of Benetton и ASOS, как использовать этот продвинутый метод расчета.

Зачем считать LTV с помощью машинного обученияВ общем виде расчет и мониторинг LTV позволяет понять текущую ценность клиентской базы и динамику ее развития. Однако имея посчитанный показатель для конкретного клиента или сегмента (когорты), бизнес понимает, на каких каналах, сообщениях, локациях, коллекциях лучше сделать акцент для привлечения наиболее доходной категории покупателей, сколько можно тратить на привлечение новых и удержание старых клиентов в каждой точке своего присутствия.

Машинное обучение что это такое урок цифры

Мониторинг LTV также позволяет компаниям увидеть, что необходимо делать для увеличения показателя. Таким образом, расчет и мониторинг LTV помогает:

  • находить новые источники знания о покупателях (1P- и 3P-данные),
  • видеть пользу от AB-экспериментов,
  • улучшать качество и использовать доступные данные,
  • заниматься интеграцией новых офлайн- и онлайн-данных о поведении покупателей.

По нашим наблюдениям, сама идея работать с LTV уже повышает КПД бизнеса. Размышления о систематизации данных и о факторах, которые выявлены с помощью ML-модели и влияют на метрику, полезны для любого бизнеса.

Согласно исследованию LTV в СНГ, больше половины компаний использует валовый метод. Однако более 25% крупного бизнеса переходят именно на ML, что явно подтверждает обоснованность таких инвестиций.

Как рассчитать LTV с помощью машинного обучения

Начать системно собирать данные. Для этого надо сначала запустить программу лояльности, пусть даже самую простую, и начать агрегировать в базе данных информацию из разных источников. Например, данные о рекламных расходах, просмотренных товарах и категориях, об использовании баллов лояльности, о действиях в мобильном приложении.

Определить факторы, которые влияют на LTV сильнее всего. Это важный этап, его не получится скопировать или перенять у другого бизнеса, так как одни и те же атрибуты (особенности, фичи) могут по-разному влиять на LTV в разных индустриях. Например, скидки положительно влияют на LTV в ритейле и негативно — в SaaS-продуктах.

Через 6–8 месяцев после того как вы начали собирать данные и определили факторы влияния, можно довольно точно предсказывать LTV. Если вы знаете ID клиента и понимаете, какие действия он совершает в онлайне и офлайне. Подробнее о пользе прогнозной аналитики (куда входит и LTV-анализ как наиболее важный) в исследовании маркетинговой аналитике в СНГ. По мере роста отдачи от аналитики резко возрастает процент компаний, который использует LTV-анализ, корреляции, рассчитывает churn rate и определяет фрод. Синхронно уменьшается процент компаний, которые не используют прогнозную аналитику. Таким образом, чем сильнее уровень влияния аналитики, тем больше эти компании инвестируют в прогнозные и предписывающие методы:

Машинное обучение что это такое урок цифры

Фрагмент исследования Coffee Analytics о маркетинговой аналитике

МнениеДанные результаты очень хорошо иллюстрируют ситуацию в компаниях и на рынке специалистов: с ростом сложности инструментов падет их доля влияния. Так LTV-анализ имеет наибольшее влияние — он информативен и относительно легковыполнимый, при этом 2-3 место с большим отрывом занимает анализ оттока и корреляции и еще менее востребована предиктивная атрибуция, так как использование этих методов требует большей глубины и понимания полученных взаимосвязей. Вероятно, это обосновано необходимостью высоких компетенций как в аналитике, так и в последующей интерпретации и внедрение полученных решений. А рынок испытывает дефицит квалифицированных кадров в области сложного анализа, соответственно не многие могут себе позволить подобные решения.

Про урокцифры:  Когда будет урок цифры 2022

Как применять LTV на практике — кейс BenettonUnited Colors of Benetton — крупный фэшн-бренд, у которого более 6000 магазинов по всему миру и более 120 в России. В конце 2018 года российское подразделение внедрило программу лояльности, которая начала бурно расти. Поэтому перед бизнесом встал вопрос о том, как грамотно оценить отдачу от этой программы и понять:

  • какие дополнительные деньги может принести программа лояльности в будущем;
  • сколько стоит привлечение нового клиента и сколько денег он принесет компании на протяжении следующего периода;
  • какова ценность всей клиентской базы;
  • от каких факторов зависит поведение клиента;
  • как через эти факторы адаптировать весь маркетинг для работы с более доходными сегментами клиентов.

Машинное обучение что это такое урок цифры

Реализовали стратегию расчета LTV, комбинируя две последовательные модели:

  • Определили вероятность того, что клиент вернется в течение будущего года (churn classification).
  • К клиентам с пороговой вероятностью возвращения применяли коэффициенты из финальной регрессионной модели и таким образом рассчитывали их LTV.

Далее расскажем о каждом этапе запуска расчета метрики.

Собирали витрину данных из всех факторов, которые могут влиять на LTV:

Машинное обучение что это такое урок цифры

Кроме того, для каждого фактора влияния подсчитывались максимальное, минимальное и медианное значения. Так, сначала для Benetton определили 646 атрибутов, которые способны влиять на LTV. Параллельно с витриной готовили архитектуру данных проекта:

  • На уровне CDP Mindbox фиксировались все данные по пользователям: транзакции, реакции на рассылки, действия в мобильном приложении и прочие.
  • На уровне облачного хранилища данных (в данном случае Google BigQuery) фиксировались данные о рекламных расходах, данные со счетчиков на сайте и данные о трафике в магазинах.

Машинное обучение что это такое урок цифры

Архитектура данных Benetton

Потом эту архитектуру доработали и полученный LTV стали передавать в Mindbox. На основе этих данных в CDP построили сегменты пользователей, которые затем использовали для настройки промоактивностей. Заметим, что эту модель можно доработать и дальше — передавать LTV в рекламные кабинеты и таким образом влиять на приоритетность показа объявлений потенциальным клиентам (например, в ретаргетинге) и при формировании look-a-like сегментов. Как Benetton соединил онлайн- и офлайн-данные для прогноза LTV:https://www. youtube. com/embed/CDkGwasCeNM

Этап 3. Расчет показателя, моделированиеПосле подготовки витрины и архитектуры данных произвели расчет показателя. Для этого подготовили две модели: одна предсказывала churn rate, другая (с помощью регрессионного анализа) считала LTV. Модель тренируется просто. Выборка данных за полный год делится на train- и test-датасеты. В первом известны реальные LTV клиентов, во втором нет. Модель тренируется на train и должна подобрать расчет, используя детали, максимально близкие к реальным LTV. Далее оценивается качество прогноза на test-датасете путем сравнения расчетного LTV с реальным значением по клиенту. Процесс повторяется, пока не будет найдено решение с минимальной квадратичной суммой всех расхождений. Получив это решение, можно делать прогноз, основанный на данных всех клиентов, пришедших за последний год и позднее, — то есть происходит внедрение модели и real-time-предсказание:

Машинное обучение что это такое урок цифры

Стратегия расчета LTV

Этап 4. Оценка решения, улучшение моделиВ качестве первого способа для определения важности использовалась модель линейной регрессии. Данные были стандартизированы для того, чтобы измеряемые величины не имели значения. Например, если будем сравнивать сумму, потраченную клиентом (рубли) и количество товаров (штуки), то из-за того, что для суммы используется другой порядок чисел, этот параметр окажет большее влияние. А стандартизация решает эту проблему. Однако линейная регрессия плохо работает с большим количеством параметров (как в данном кейсе), поэтому далее применили алгоритм GBL, основанный на деревьях решений (decision trees). Результат был значительно лучше по всем метрикам качества. Топ-20 фич для алгоритма GBL, после того как убрали высококоррелирующие (проверка на мультиколлинеарность):

Машинное обучение что это такое урок цифры

Влияние одних и тех же факторов на LTV в разных видах бизнеса

У Benetton большая клиентская аудитория. Поэтому каждый день появлялся сегмент клиентов, которые ровно год назад вступили в программу лояльности. Данные таких клиентов автоматически отправлялись для обучения модели и улучшали качество предсказания LTV по новым потребителям. После запуска модели началась вторая часть по расчету LTV — постоянная проверка того, какие еще данные можно добавить к модели. Если их находили, то добавляли в существующую модель, которая заново проводила оценку решения. После этого цикл возвращался к шагу поиска и подготовки новых данных. По сути, этот процесс не прекращается, и модель расчета LTV можно дорабатывать постоянно, чтобы получать более надежные результаты в метриках. Финальная модель. Анализирует недельные когорты на определение LTV их клиентов. Учитывает все ключевые косвенные факторы (например, рекламные источники), которые в долгосрочной перспективе повлияли на совершенные в этот период покупки (годовой LTV). В результате уровень расхождения между предсказанием и фактическим значением в первые несколько месяцев постепенно снижался, хотя было еще мало данных (большинство клиентов зарегистрировались в программе лояльности 1–3 месяца назад). Далее с увеличением объема данных качество предсказания улучшается по всем когортам:

Машинное обучение что это такое урок цифры

Также модель можно улучшать через:

  • доработку churn-классификатора (вернется клиент или нет);
  • внедрение разных коэффициентов для покупателей, начавших свою «жизнь» в один и тот же период.

Этап 5. Внедрение в маркетинг, визуализация отчетов в Power BI

После расчета и применения модели LTV построили несколько отчетов, которые United Colors of Benetton использует в следующих случаях:

  • оценка эффективности программы лояльности;
  • сегментация клиентской базы;
  • качество работы акций;
  • оценка рекламных кампаний.

Примеры отчетов LTVLTV в динамике. Отчет об эффективности базы позволяет понять, сколько денег получит компания, даже если база не будет расти в течение года:

Машинное обучение что это такое урок цифры

Факторы влияния на LTV. Отчет позволяет увидеть, почему какие-то клиенты приносят больше денег, чем другие. Показывает, как изменение одного фактора влияет на изменение LTV в целом:

Машинное обучение что это такое урок цифры

Сегментация клиентской базы. После того как факторы влияния были определены, Benetton смог создавать кастомные сегменты и передавать их в Mindbox. Например, при помощи отчета по сегментации базы определили пользователей, наиболее склонных покупать новые коллекции, и запустили для них специальную рекламную кампанию:

Машинное обучение что это такое урок цифры

Когортный отчет с рекомендациями. Когортный анализ показал, что обычно лишь небольшая часть дохода генерируется новыми клиентами — понять это помог большой наплыв новых клиентов в четвертом квартале 2020 года. Старые клиенты (с первого квартала 2019 года) — самые стабильные. Кроме периода коронавирусных ограничений, они приносили бо́льшие суммы, чем клиенты, которые вступили в программу лояльности в другие периоды. Похоже, когорты клиентов, которые зарегистрировались в определенные кварталы, склонны проявлять наибольшую активность в эти же кварталы и в дальнейшем. Так выглядит оборот с клиентов, стартовавших в программе лояльности в разных кварталах 2018–2021 годов:

Машинное обучение что это такое урок цифры

Таким образом, Benetton прошел весь цикл от описательной аналитики к предписывающей:

Машинное обучение что это такое урок цифры

Benetton привязывает маркетинговые цели к изменению LTV. Например, цель во втором квартале — вырастить LTV на 5% и инвестировать для этого в рекламу и программу лояльности 5 млн рублей. (Цифры условны и не отражают реальности Benetton).

Результаты игры «Барашек Джузеппе»:

заработали на каждый потраченный на игру рубльбольше чеков у сегмента играющих клиентоввыше LTV у игравших клиентов

МнениеМы повышаем LTV через контроль размеров ключевых аудиторных сегментов (лучшие, лояльные, киты, новички, уходящие и т. ) и характерного перетекания клиентов между ними. Цель — при увеличении базы не снижать процент участников программы лояльности с покупками и увеличить процент покупателей, попадающих из активных в лучшие по характеристикам сегменты. Так мы добиваемся роста среднего LTV клиента на десятки процентов год к году.

Машинное обучение что это такое урок цифры

Андрей Буреничев, интернет-маркетолог Benetton

Такой подход совпадает с тем, как все индустрии планируют увеличить LTV. Согласно исследованию Coffee Analytics, удержание клиентов (retention) — наиболее популярный способ повысить LTV. Другие способы:

Машинное обучение что это такое урок цифры

Особенно стоит отметить интерес товарных компаний к блокам «Данные» (54%) и «Лучше маркетинг» (70%) — это связано как с меньшей маржинальностью, так и с более высокой конкуренцией на рынках:

Машинное обучение что это такое урок цифры

Кейс ASOS из Великобритании — высший пилотаж расчета LTV

Расчет LTV для компании ASOS создал Имперский колледж Лондона (Imperial College London). Этот кейс интересен тем, что архитектура проекта, помимо churn rate и регрессионной модели LTV, учитывает эмбединги (embedding — группировка слов, встречающихся в схожем контексте).

Вызовы ASOSВ компании действует бесплатная доставка и возврат, то есть легко получить отрицательный LTV клиента. Для снижения этих рисков компания поставила цель точно прогнозировать отток клиентов и считать LTV. Такая стратегия решения во многом схожа с кейсом Benetton.

Модель расчета каждый день «тренируется», используя новые данные за последние два года. Это позволяет учитывать сезонность данных. Обучение модели проходит в два этапа:

  • Предобработка данных и обучение Random Forest для прогнозирования оттока и LTV.
  • Калибровка данных (сопоставление процентилей с реальными значениями).

Машинное обучение что это такое урок цифры

Архитектура данных для проекта ASOS

Особенности моделиВ проекте для улучшения результатов прогнозирования используется принцип из обработки естественных языков (NLP): embeddings (внедрения, связки между элементами разной природы), который заключается в группировке слов, встречающихся в схожем контексте. Аналогичным образом происходит группировка покупателей по однотипности их интереса к товарам:

Машинное обучение что это такое урок цифры

Пример эмбедингов для проекта ASOS

В проекте ASOS пересекают между собой пользователей и продукты — такой подход часто называется «коллаборативной фильтрацией». Таким образом находят похожих друг на друга клиентов и через эмбеддинг в виде связки «продукт — пользователь» улучшают предсказание LTV.

Также рекомендуем управленческий мастер-класс Coffee Analytics, Mindbox и Benetton, где моделировалась кризисная ситуация падения дохода с клиента:

Презентация с мастер-класса об LTV на конференции «Полезный маркетинг»

Полный кейс Benetton

МнениеТри важных пункта, на которые стоит обратить внимание:

  • Сейчас большинство компаний используют валовый метод. Это просто формула, ее легко рассчитать. Если у вас данные уже собраны в одном месте, вы можете это сделать прямо сейчас.
  • Статистические методы — это тоже по сути формулы, но чуть более сложные. Преимущества их в том, что от «средней температуры по больнице» мы переходим к более точным моделям.
  • Машинное обучение необходимо для того, чтобы знать, сколько принесет конкретный клиент и что на это повлияет конкретно в вашем случае. Компании, которые выбрали этот метод, со временем смогут не только предсказывать, но и управлять этой метрикой.

Машинное обучение что это такое урок цифры

Анна Виноградова, руководитель отдела аналитики Coffee Analytics

МнениеУ машинного обучения масса достоинств, среди которых — экономия времени сотрудников и избавление от ошибок, вызванных человеческим фактором. Считается, что эта технология доступна только промышленным гигантам из-за своей дороговизны. Однако опыт нашего клиента, обувной компании Mario Berlucci с 200 000 посетителей сайта в месяц, доказывает, что это не так. В отделе data science Mario Berlucci пять сотрудников: аналитик, два специалиста data science, маркетолог и разработчик. Этого штата хватило, чтобы за полгода реализовать механику с предсказанием действий пользователей, которая приносит компании более 30% выручки. Помимо этого, бренд использует подразделение data science в паре с командой управления финансами: машинное обучение для бизнеса применимо много где, и не только в маркетинге.

Про урокцифры:  Урокцифры рф для 1 4 классов пройти и получить сертификат сейчас

Чему в 2021-м учились в мире

Ажиотаж в онлайн-обучении оказался ниже, чем в подогретом пандемией 2020 году: 40 млн новых учащихся, зарегистрировавшихся как минимум на один открытый электронный курс, против 60 млн. Тем не менее, онлайн-образование основательно закрепилось в нашей жизни. Тематика курсов максимально широкая. Например, на Coursera в числе наиболее популярных программ за последние два года есть и машинное обучение, и основы UX, и well-being. А образовательная платформа edX в своем ревью отмечает, что в число лучших курсов вошли программы по Excel, экологии, финансовому учету и пищевой ферментации.

Чему в 2021 году учились в России

Евгений Лебедев, руководитель «Яндекс. Практикума» в России, также подтверждает, что онлайн-образование только набирает обороты: «Сегодня огромная часть россиян заинтересована в перепрофилировании, получении новых востребованных навыков. Все более популярным инструментом для перехода в новую профессию становится онлайн-образование. Если опираться на опыт «Практикума», наиболее востребованными образовательными программами среди наших студентов остаются такие направления как программирование на разных языках (курсы выбрали 40% учащихся в 2021 году) и аналитика данных (25% в 2021 году). Также мы видим увеличение спроса на направления маркетинга, управления и дизайна. В них заинтересован и рынок: по последним данным исследования Института образования Высшей школы экономики, 78% выпускников «Яндекс. Практикума» успешно трудоустраиваются на новую работу, каждый шестой — не дожидаясь окончания обучения».

Машинное обучение что это такое урок цифры

Артем Казаков, коммерческий директор Skillbox, отметил, что пользователи чаще всего выбирают программы ИТ-специальностей, особенно «Python-разработчик» и «1С-разработчик». Интерес к Python Артем объясняет его простотой и актуальностью в области интеллектуального анализа данных и машинного обучения. Также эксперт прогнозирует, что спрос на ИТ-программы будет оставаться высоким и в будущем.

Другие популярные программы онлайн-университета — «Графический дизайнер», «SMM-специалист» (которая подходит как новичкам, так и владельцам бизнеса) и универсальный трек «Веб-разработчик», на котором пользователи с нуля учатся создавать полноценные сайты и веб-приложения.

Что касается корпоративного обучения, статистика следующая: по данным «СберУниверситета», организаторы корпоративного образования предоставляют сотрудникам программы, направленные на развитие узкопрофессиональных навыков (41,2%), работы в команде (36%), лидерства (34,6%) и других важных для работы компетенций.

Но сотрудникам все же более интересны soft skills и кросс-функциональные навыки. Так, по данным LXP-платформы для корпоративного обучения K-AMPUS, сотрудники чаще всего изучали программы по личной эффективности (21%), управлению проектами (27,4%), agile-техникам (18%), дизайн-мышлению (12%) и целеполаганию (22%).

Машинное обучение что это такое урок цифры

Что изучать в 2022 году, чтобы повысить свою профессиональную ценность

Несмотря на возрастающий тренд на непрерывное обучение, исследования показывают: специалисты применяют только 37% приобретаемых навыков. Одна из причин заключается в том, что часть из них просто не нужны, но были назначены сверху. Для того чтобы сделать обучение эффективным, необходим индивидуальный план, сформированный с активным вовлечением самого обучающегося из трех областей: профессиональные навыки, soft skills, развитие кругозора. Ниже представляем список наиболее актуальных навыков по каждому из этих направлений.

Hard skills 2022

Исследователи рекомендуют в 2022 году сфокусироваться на следующих профессиональных областях:

  • Информационные технологии и кибербезопасность. Борьба с киберпреступлениями будет обходиться международному бизнесу в $6 трлн в год в условиях жесточайшего дефицита специалистов в этой сфере. Область кибербезопасности — отличный долгосрочный выбор для индивидуального и корпоративного обучения.
  • Анализ данных. Выбор верных бизнес-решений и способов продвижения проекта во многом зависит от того, насколько умело команда работает с данными и умеет прогнозировать результаты. Аналитические навыки становятся все более актуальными как отдельная профессия (по данным Deloitte, в этом году в США доход аналитиков вырастет до $130,2 тыс.), при этом являются важным и веским дополнением к основным профессиональным компетенциям.
  • UX-дизайн. По версии MyJobMag, в 2022 году в первую очередь нужно заниматься развитием навыков в UX-дизайне, потому что именно они помогают создавать продукты, которые полезны и комфортны для пользователя. Курсы по UX-дизайну пригодятся не только непосредственно дизайнерам, но и всем, кто связан с созданием, обслуживанием и продвижением продукта.
  • Контент-маркетинг. По прогнозам, к 2025 году рынок контент-маркетинга вырастет на $417,85 млрд. Обучение в этой сфере пригодится и фрилансерам, и специалистам корпораций. Рекомендуем дополнять курсы по контент-маркетингу обучением по созданию разных форматов. Первые помогают определиться с целями и контент-стратегией компании, а вторые позволяют делать качественный и актуальный контент.
  • Производство контента. В 2021 году люди ежеминутно смотрели 167 млн видео, время нахождения на стриминговых сервисах выросло с получаса до часа, а число слушателей подкастов в США достигло 120 млн. В России подкасты пока не так популярны, но ожидается, что к 2024 году их будут слушать около 28 млн человек. Кроме этого, 54% потребителей хотят смотреть больше видео от любимых брендов. Поэтому бизнесу становится интересно и выгодно производить видеоконтент собственными силами, а не отдавать его на аутсорс, а также работать с людьми, которые понимают, как делаются подкасты. Это, в свою очередь, повышает спрос на специалистов, которые могут как собрать команду, так и создавать контент без сложного продакшена.

Soft skills 2022

Обучаясь на курсах, которые дают вам сугубо профессиональные навыки, не забывайте про soft skills. Они сейчас не менее, а иногда даже более важны. По итогам глобального исследования Future of Work, 63% работодателей готовы взять на работу специалистов с ярко выраженными гибкими навыками — командная работа, тайм-менеджмент или лидерство — и самостоятельно обучить их техническим аспектам работы.

Машинное обучение что это такое урок цифры

К наиболее важным гибким навыкам 2022 года относят:

  • Умение решать проблемы и действовать нестандартно. Это не только позволяет найти подходящие решения, но и отлично расширяет кругозор и помогает в нетворкинге.
  • Стратегическое планирование. Здесь самое главное — умение анализировать информацию, выявлять тренды, ставить цели и выбирать правильное направление для развития человека или бизнеса.
  • Принятие решений — один из ключевых навыков для лидеров. Если вы хотите управлять командами и создавать продукты, которые меняют мир, важно научиться быстро сканировать всю доступную информацию, использовать интуицию, выбирать один из множества вариантов и убеждать людей, что нужно идти именно этим путем.
  • Активное слушание — это навык, который пригодится не только при общении с близкими, но и для работы в самых успешных командах, которые придерживаются принципа этнического и культурного разнообразия. А там нужно уметь договариваться практически обо всем.
  • Логистика находится на стыке навыков, которые нужны для успешной работы, и навыков, которые пригодятся для комфортной жизни. Каждому из нас для профессионального развития уже недостаточно выполнять только узкий круг обязанностей, при этом ценность семьи и личного времени возрастает. Логистические навыки помогут выбрать оптимальные маршруты, экономить время на дорогу и тратить его на важные для вас занятия.

Эрудиция

Широкий кругозор — это обязательное условие для развития важных soft skills. Он помогает замечать неочевидные связи между явлениями, стимулирует креативность и подпитывает любопытство. Эрудицию можно развивать с помощью путешествий, книг, статей, коротких видео, подкастов и коротких курсов. Углубляйтесь во все, что вам было интересно ранее, и непрерывно узнавайте новое.

Например, уже сегодня можно выбрать интересный материал на таких бесплатных просветительских ресурсах:

  • TED Talks
  • Универсариум
  • Теории и практики
  • Лекториум
  • ПостНаука

Машинное обучение что это такое урок цифры

В заключение хочу отметить, что есть два навыка, которые никогда не потеряют актуальность и значимость: цифровая грамотность и критическое мышление. Благодаря этим умениям вы будете чувствовать себя безопасно в онлайн-пространстве, сможете защищаться от киберпреступников и фейковых новостей, а также выбирать действительно качественные материалы для образования в любой интересующей вас сфере. Кроме этого, цифровая грамотность и критическое мышление становятся ключевыми навыками, которые помогут найти хорошую работу.

Согласно исследованию Markle, восемь из десяти рабочих мест теперь требуют цифровой грамотности, а руководители высшего звена во всем мире рассматривают «критическое мышление и анализ» как группу навыков, значение которой, скорее всего, возрастет в период до 2025 года. При этом именно эти навыки сегодня — ваше конкурентное преимущество на рынке труда: даже среди технически подкованных миллениалов еще мало людей, которые могут смело указывать их в резюме. А ведь от умения пользоваться технологиями и отличать хорошее от плохого зависят и ваша репутация, и карьерные перспективы, и размер банковского счета.

Собрала для вас подборку из 60 курсов, которые рекомендую к прохождению в 2022 году. Изучайте, выбирайте лучшие и осваивайте навыки, которые помогут вам и вашим сотрудникам стать еще более конкурентными завтра и в более отдаленном будущем.