NoML Digest
1.84K subscribers
76 photos
1 video
2 files
592 links
База знаний https://noml.club
Чат https://t.me/noml_community
YouTube https://www.youtube.com/@NoML_community

По всем вопросам к @psnurnitsyn
Download Telegram
На этой неделе коллеги из GlowByte Advanced Analytics участвуют в паре мероприятий, которые посвящены скорингу и кредитным рискам.

Обсуждение по этой теме в нашем войс чате устроим на следующей неделе, а пока информация:

1️⃣ Сегодня, 14 сентября в 18:30 МСК вебинар “ML/DS тренды в задачах управления кредитным риском”.

Спикеры:
😎 Евгений Степанов, Управляющий директор, Банк ФК Открытие, Data Science
😎 Александр Бородин, Руководитель направления аналитики и моделирования в финансах и рисках, GlowByte Advanced Analytics
😎 Алиса Пугачева, Бизнес-аналитик, эксперт по моделированию кредитных рисков, GlowByte Advanced Analytics

Детали и регистрация по ссылке.

2️⃣ А в четверг, 16 сентября Александр Бородин выступит на конференции Scoring Day X с докладом “Контролируемые эксперименты в скоринге и оценке риска: тренды и кейсы”.

Если вы там будете, подходите к нашему стенду!
А если не будете, то запись доклада должна появиться на следующей неделе, ссылку пришлём)
На этой неделе случилась накладка по теме планируемого голосового чата. Но мы все равно решили собраться и немного пооффтопить, а именно попробовать найти ответ на часто задаваемый нам вопрос: почему и зачем возникла идея собирать очередное сообщество по темам DS/ML? 🧐Также расскажем про наши планы на будущее, что еще мы хотим делать в рамках сообщества, и будем очень рады, если кто-то присоединиться к нашей дискуссии и выскажет пожелания и предложения по развитию NoML🚀

Ну и в целом видимо порассуждаем на более общие темы вокруг сообществ в принципе:
Зачем нужны сообщества?
Почему сообщества начали появляться в последние годы? Где мы были раньше?
Чего добиваются сообщества?
Что дают сообщества? И как они влияют на личное развитие?

Встречаемся сегодня, 16 сентября, в 21:00 МСК в голосовом чате.
В эту пятницу, 24 сентября будет онлайн конференция Yandex Scale 2021, посвященная сервисам платформы Yandex.Cloud.

Есть даже статья про треки и основные темы в виде интервью с ответственными за секции конференции: Польза, а не маркетинг. Почему стоит потратить время на конференцию Yandex Scale 2021.

А с участием команды GlowByte Advanced Analytics будет выступление про кейс использования ML сервисов Yandex.Cloud как для разработки, так и для применения моделей:
Рекомендательная система на базе DataSphere
​​😎Александр Арланов, БУРГЕР КИНГ
😎Алёна Дробышевская, Yandex.Cloud
😎Андрей Иванов, GlowByte Advanced Analytics

Полная программа и регистрация по ссылке. Пишут, что регистрация закроется 22 сентября.

P.S.: А в нашем голосовом чатике про облака поговорим в следующий четверг, 30 сентября) следите за анонсами!
Сори, оффтоп.
Немного квантовой механики и теории чисел в ленту:
📺 A. V. Ustinov, M. B. Skopenkov, Feynman Checkers: Number Theory in Quantum Electrodynamics.
Доклад был в рамках конференции по аналитической теории чисел памяти Виноградова, прошедшей в начале прошлой недели, захотелось с кем-то поделиться)

Первые 20-25 мин. - про постановку задачи, доступно всем, кто знает элементарный тервер, и имеет популярное представление о физике элементарных частиц. Потом минут 5-10 про общую идею доказательства, как раз методами аналитической теории чисел, но очень очень кратко, если кому-то вдруг интересно, за деталями точно в статью авторов:
📄 M. Skopenkov, A. Ustinov, Feynman checkers: towards algorithmic quantum theory.
Cнова сходили на конференцию про скоринг и кредитные риски, на этот раз Scoring Day. И решили продолжить обсуждать тренды в моделировании кредитных рисков, тем более что в прошлый раз успели затронуть далеко не все заявленные темы.

Вопросы, которые хотим обсудить в этот четрвег, можно разделить на два основных блока:

1️⃣ Модели и аналитика в скоринге
📌 Контролируемые эксперименты и A/B фреймворк в оценке кредитных рисков.
📌 Задачи математической оптимизации в скоринге.
📌 Особенности сегментации и кластеризации в контексте рисковых моделей.
📌 Скоринговые, маркетинговые и другие бизнес задач как часть общей парадигмы принятия оптимальных решений.

2️⃣ ModelOps & MLOps в контексте кредитных рисков
📌 Модельный риск, ключевые процессы для управления модельным риском.
📌 Современная Data&ML платформа как средство митигации модельного риска.
📌 Ну и скорее всего про мониторинг и валидацию поговорим еще раз

Встречаемся в четверг, 23 сентября в 21:00 МСК в голосовом чате. Присоединяйтесь!
Записи мероприятий про модели в кредитных рисках, прошедших на прошлой неделе.

📺 Вебинар:
Евгений Степанов, Александр Бородин, Алиса Пугачева - “ML/DS тренды в задачах управления кредитным риском”.
(В записи в начале 9 холостых минут, видимо кто-то подумал, что мелодия хорошая) правда мелодия минуту, потом 7 минут тишины…🤔)

📺 Выступление на конференции Scoring Day X:
Александр Бородин - “Контролируемые эксперименты в скоринге и оценке риска: тренды и кейсы”.
(А тут в начале первые 3 минуты какие-то проблемы с презентацией, можно промотать, а можно посмотреть как Саша выкручивается)))

Смотрите и приходите завтра в голосовой чат задавать вопросы спикерам!
Еще одна запись выступления с конференции Scoring Day, теперь про кейс построения MLOps платформы:
📺 Павел Николаев (Открытие), Лина Чуднова (Neoflex) - Внедрение общебанковской платформы MLOps в банке «Открытие». Experience and lessons learned
Павел Николаев также примет участие в нашей сегодняшней дискуссии😎
Подключайтесь к обсуждению!
По мнению Gartner, к 2022 году публичные облачные сервисы будут необходимы для 90% инноваций в области данных и аналитики.

Про то, почему облака - это данность, и поговорим с Алёной Дробышевской из Яндекс.Облака в этот четверг в нашем голосовом чате.

Более подробный анонс будет немного позже (а может быть и не будет, и так всё понятно))). А пока можно посмотреть запись трека ML&AI прошедшей на прошлой неделе конференции Yandex.Scale.
Облака
NoML Community
Тема Feature Store очень активно развивается, почувствовали острую необходимость снова поговорить и про FS и вообще про данные в DS и ML (что и как обсуждали в прошлый раз).

В этот четверг (7 октября) в 21:00 по Москве собираемся в голосовом чате и обсуждаем следующие вопросы:

Как выглядит процесс подготовки данных для ML, кто его основные участники? То есть снова о том, кто такие DE и MLE и чем они должны заниматься?=)
Область Feature Store сравнительно новая и находится на этапе становления, какими свойствами должен обладать FS? Какие задачи может решить FS, а какие нет?
Как Feature Store встраивается и в процесс построения решений на базе продвинутой аналитики и в платформу Data&ML?
Что делать? Пробовать решения на рынке или строить свое?

Подключайтесь и послушать и поговорить!
Коллеги из GlowByte Advanced Analytics описали свое видение технологии FS:
👊 Как поссорились Инженер и Ученый. Статья про данные для ML и FeatureStore

Читайте, ставьте лайки и подключайтесь в четверг обсуждать и задавать вопросы авторам:
😎 Ольге Корольковой и
😎 Сергею Абрамову

🐣🐓🤔
Дополнение к предыдущему списку решений Feature Store, за которыми активно следит команда GlowByte Advanced Analytics:
🔹Splice Machine
🔹Molecula FeatureBase
🔹Databricks Feature Store
🔹Google Vertex AI Feature Store

Кстати, я так и не понял, занимаются ли в Iterative.ai (кодовое слово DVC) разработкой решения класса Feature Store? Где-то мелькали какие-то такие заявления со ссылками вот на этот пост: MLOps startup Iterative.ai nabs $20M.

А с чем сталкивались вы? Пишите в комментариях, добавляйтесь в чат, если вас там вдруг нет, и приходите обсуждать в этот четверг🎙
Кратко про развитие концепции Feature Store и по сути еще одно перечисление основных игроков на рынке этой технологии:
📌 Feature Store Milestones

Также на следующей неделе, 12-13 октября, намечается целая конференция
📌 Feature Store Summit

Среди докладов вроде бы как и кейсы представителей индустрий (Spotify, Twitter, Redis, Vanguard, Bosch, Varo, OLX, Uber, Via, Wildlife Studios, Stanford), и доклады от разработчиков решений FS и не только (Hopsworks, Salesforce, Iguazio, Amazon, Kaskada, Databricks, Rasgo, Galileo, Gantry, Microsoft, getML). Соотношение 50/50, что в целом не плохо)
Активные спикеры в сегодняшнем обсуждении Feature Store:
😎 Сергей Ярымов, дата инженер, МТС
😎 Сергей Абрамов, руководитель направления Feature Store (или FeatureOps, или еще как-то, мы так и не определились с названием🤦), GlowByte Advanced Analytics
😎 Ольга Королькова, эксперт направления описанного выше, GlowByte Advanced Analytics
Доклад про кейс построения FS в МТС на конференции SmartData на следующей неделе:
📌 14 октября 20:00, Как мы строим Feature Store, Сергей Ярымов, Data Engineer в МТС Big Data

Вообще конференция платная, но на Community Day 14 октября регистрация бесплатная, так что регистрируйтесь, Сергей вчера сказал, что будет интересно=)
📌 Еще пара статей про FS:
1️⃣ MLOps: The Role of Feature Stores
2️⃣ MLOps: Building a Feature Store? Here are the top things to keep in mind
FeatureOps и ProductionOps - все таки есть новые экземпляры XOps=)
Вторая статья прямо сильно перекликается с вопросами, которые вчера поднимали.

📌 И кейс Feature Store для Edge:
A Streaming Feature Store Based on Flink and the AWS SageMaker Feature Store API