NoML Digest
1.85K subscribers
76 photos
1 video
2 files
599 links
База знаний https://noml.club
Чат https://t.me/noml_community
YouTube https://www.youtube.com/@NoML_community

По всем вопросам к @psnurnitsyn
Download Telegram
На следующей неделе обсудим, что делать если A|B тестирование провести нельзя, а понять влияние воздействия необходимо, а именно, как в таких случаях применяются методы каузальности.

Встречаемся в голосовом чате в Telegram 17 июня в 21:00 МСК. (❗️Обратите внимание, что это четверг а не вторник).

В повестке обсуждения:
📌В каких случаях применяются методы каузальности и эконометрики?
📌Что это за направление?
📌Какие методы к нему относятся?
📌Какие рабочие, а какие не очень?
📌Какие реализованы в библиотеках?
📌Какие есть сложности?

Наши эксперты-спикеры:
😎Ирина Голощапова, PhD, Head of Data Science at LENTA
😎Максим Цыганков, Руководитель проектного направления «Оценка программ и политик», Центр перспективных управленческих решений
😎Наталья Тоганова, к.э.н., Бизнес-аналитик, GlowByte Advanced Analytics
😎Александр Бородин, к.ф.-м.н., Руководитель направления аналитики в финансах и рисках, GlowByte Advanced Analytics
Рекомендовали уже когда-то ранее, пара книг по теме каузальности, почитать на выходных:
📕Pearl J., Mackenzie D., The Book of Why: The New Science of Cause and Effect
📗Peters J., Janzing D., Schölkopf B., Elements of Causal Inference: Foundations and Learning Algorithms
Подборка небольших статей про каузальность

📌 Статьи, которые питчат за «каузальный» подход:
📄 Why do we need causality in data science? – первая из серии статей
📄 Why every data scientist shall read “The Book of Why” by Judea Pearl – краткий обзор книги (кстати, если у вас есть подписка на SmartReading – там есть саммари книги на русском – почти реклама 🙈).

📌 Введение в Causal Inference в трех частях:
📄 Causal inference (Part 1 of 3): Understanding the fundamentals

📌 Статья, которая рассказывает об опыте применения в Uber:
📄 Using Causal Inference to Improve the Uber User Experience
Всем привет! 👻 вчера мы не затронули тему каузальности и выбора фичей.
Литературы много, поэтому хотим порекомендовать одно, но прекрасное видео:
📺 Ольга Филиппова: Causality and Shapley Values
Вчера в обсуждении упоминали кейс Северстали:
📺 Boris Voskresenskii: Causal inference for a steel mill

В каком то смысле есть преемственность между темой прошлой недели и темой этой недели)
А мы плавно переходим к теме следующей недели: рекомендательные системы. Хороший пост про новые тренды:
📌 What’s new in recommender systems

Кстати, еще про преемственность наших тем, в упомянутой статье помимо графов и бандитов есть и про методы causal в задачах рекомендательных систем, а именно авторы рекомендуют обратить внимание на следующие работы:
📄 Stephen Bonner, Flavian Vasile, Causal Embeddings for Recommendation
📄 Yixin Wang, Dawen Liang, Laurent Charlin, and David Blei, Causal Inference for Recommender Systems
📄 Neela Sawant, Chitti Babu Namballa, Narayanan Sadagopan, and Houssam Nassif, Contextual Multi-Armed Bandits for Causal Marketing

Список можно еще расширить
📄 Amit Sharma, Jake M. Hofman, Duncan J. Watts, Estimating the causal impact of recommendation systems from observational data
📄 The Deconfounded Recommender: A Causal Inference Approach to Recommendation
📄 Shuyuan Xu, Yingqiang Ge, Yunqi Li, Zuohui Fu, Xu Chen, Yongfeng Zhang, Causal Collaborative Filtering
📄 Dawen Liang, Laurent Charlin, David M. Blei, Causal Inference for Recommendation

В общем, если не было планов на выходных, можно засесть изучать тему надолго 👩‍🎓👨‍🎓📚🤪
Во вторник, 22 июня коллеги из GlowByte Advanced Analytics выступают на вебинаре Яндекс.Облако "Рекомендательные системы. Архитектура и применение"

Коллеги расскажут про архитектуру рекомендательных систем на базе сервисов платформы Яндекс.Облако, а также поделятся опытом построения рекомендательных систем для решения бизнес задач в различных индустриях и направлениях.

Спикеры от GlowByte Advanced Analytics:
😎Дмитрий Бутаков, архитектор Data&ML платформ
😎Андрей Иванов, руководитель направления прогнозной и оптимизационной аналитики цепочек поставок

Регистрация по ссылке
В четверг, 24 июня, в 21:00 МСК встречаемся в голосовом чате и обсуждаем рекомендательные системы.

В повестке обсуждения:
📌В каких бизнес-задачах можно применять рекомендательные системы?
📌Когда можно использовать базовые методы и эвристики, а когда необходим продвинутый ML?
📌Как подойти к выбору целевой архитектуры рекомендательных систем? Для каких задач достаточно offline предрасчета, а когда может понадобится аналитика реального времени и streaming?
📌На что обратить внимание при оценке качества моделей рекомендательных систем в контексте конкретных бизнес задач?

Участники дискуссии:
😎Армен Амирханян, тимлид команды ML, Спасибо от Сбербанка
😎Данила Наумов, CDO, Утконос
😎Борис Устюгов, Head of DS, Утконос
😎Михаил Галкин, руководитель направления клиентской аналитики, GlowByte Advanced Analytics
😎Дмитрий Бутаков, архитектор Data&ML платформ, GlowByte Advanced Analytics
Всем, кто был сегодня с нами, еще раз спасибо!
А вот рекомендации посмотреть про рекомендации, о которых сегодня говорили=)
📺 Дзен-митап: алгоритмы и рекомендации
📺 Tinkoff AI. RecSys
Forwarded from Personalization_ru (Anna Ambrozevich)
Жара в самом разгаре🔫 А мы делимся подборкой статей про рекомендации на Netflix.
Знали ли вы, что в 2013 году Netflix получил награду Эмми за “Технологию персонализированных рекомендаций для выбора видео”🏆, а что они предложили награду в 1 млн долларов💰 той команде, которая сможет улучшить нативный рекомендательный движок Netflix Cinematch?
И что, в конце концов, они пошли еще дальше и персонализировали обложки для фильмов для разных сегментов пользователей. Все секреты в статьях ниже (eng):
- история персонализации Netflix https://marker.medium.com/a-brief-history-of-netflix-personalization-1f2debf010a1
- персонализация домашней страницы от Netflix https://netflixtechblog.com/learning-a-personalized-homepage-aa8ec670359a
- персонализация обложек фильмов от Netflix https://netflixtechblog.com/artwork-personalization-c589f074ad76
В этот четверг, 1 июля в 21:00 МСК будем разбираться чем MLOps отличается от ModelOps, что такое жизненный цикл моделей ML и зачем им управлять, а также, как выстраивать работу Data Science команды.

Затронем следующие вопросы:
Управление или управление моделями: Model Management vs Governance?
Что такое модельный риск, и почему этот термин становится актуальным не только для финансовых институтов?
Какие бывают методологии управления DS/ML проектами? Что выбрать: CRISP-DM, SEMMA, KDD или что-то еще?
Какие есть роли в реальных Data Science проектах помимо Data Engineer, Data Scientist и ML Engineer? И как эти роли распределены между бизнесом и IT?

Участники дискуссии - команда GlowByte Advanced Analytics:
😎 Андрей Гаркавый
😎 Михаил Зайцев
😎 Александр Кухтинов
😎 Павел Снурницын

Встречаемся, как обычно, здесь в голосовом чате.
Коллеги из команды ModelOps GlowByte Advanced Analytics написали небольшой пост
🐓🐓🐓 Как и зачем управлять ML-моделями?
(Про кур не спрашивайте, кто не понял тот поймёт🐣)
MLOps - то что захватывает меня последнее время, но у меня много претензий к текущим решениям и продуктам.

Расскажите про ваши открытия и библиотеки, даже если они давно известны, в комментарии к этому посту.

А в четверг будет онлайн-митап. Если у вас нет MLOps или вы уже опытный в этом, подключайтесь посмотреть. Уверен, что будет интересно. А мой коллега, Роман, расскажет про MLOps в Lamoda.
Про правильный ответ на вопрос, есть ли разница между терминами MLOps и ModelOps.
Если конечно можно так говорить, в конце концов это лишь игра определений.

В своих материалах Gartner все таки разделяет эти понятия, область ModelOps более широкая чем MLOps:
“AI model operationalization (ModelOps) is primarily focused on the governance and life cycle management of all AI and decision models (including models based on machine learning, knowledge graphs, rules, optimization, linguistics and agents). In contrast to MLOps, which focuses only on the operationalization of ML models, and AIOps which is AI for IT Operations, ModelOps focuses on the operationalization of all AI and decision models.”
Источник цитаты, а также целый вебинар на эту тему
ModelOps vs MLOps – What’s the difference and why should you care

Кстати, на сайте компании ModelOp достаточно много интересных и полезных ресурсов по теме ModelOps/MLOps:
📄 Статьи
📺 Вебинары
📕 Всевозможные отчеты о состоянии MLOps
❗️ и даже (хороший ход) пример ModelOps RFP Requirements
Чувствую после этого поста придется потом самому и отрабатывать эти требования😅🤦👨‍💻

Ну и еще пара текстов про ModelOps vs MLOps
📌 At last, a way to build artificial intelligence with business results in mind: ModelOps
📌 ModelOps vs. MLOps
📌 И конечно же истина всех истин - Wikipedia🎓🎓🎓
С самого начала становления области анализа данных и его применения для индустриальных задач появилась потребность формализовать подходы аналитики. Результатом стали разнообразные методологии управления процессом, который сейчас приянато называть Data Science.

Например, про такие методологии, как KDD, CRISP-DM SEMMA и их сравнение можно почитать здесь:
📌 Data Science project management methodologies
а еще есть TDSP:
📌 How to run a Data Science Team: TDSP and CRISP Methodologies
и другая экзотика, например, ASUM-DM.

На мой взгляд идеальной методологии, по которой можно было бы работать с задачами DS как по шаблону, не существует. В каждом случае каждой конкретной команды хорошим подходом будет взять лучшее из перечисленных методологий, добавить практики согласно своему опыту и потребностям и получить методологию процесса анализа данных с учетом специфики своей области и индустрии.

А еще полученная методология DS должна вкладываться в методологию проектного управления реализации конечного ML/AI решения. Хороший пример - подход LeanDS:
📌 Гибкое управление DS продуктами