NoML Digest
1.84K subscribers
76 photos
1 video
2 files
593 links
База знаний https://noml.club
Чат https://t.me/noml_community
YouTube https://www.youtube.com/@NoML_community

По всем вопросам к @psnurnitsyn
Download Telegram
Подборка ресурсов для изучения DS/ML от участников прошедшей в четверг дискуссии.

Артём Глазунов @artglazunov:
🖥 Специализация на Coursera Deep Learning. Прекрасная специализация для всех, вне зависимости от уровня. Пропитана духом Стэнфорда и любовью к ML
🖥 Специализация на Coursera Algorithms. Алгоритмы нужны, это факт. А в этой специализации есть задачки и для матёрых специалистов. При этом подача живая и увлекательная.
🖥 Курс на Coursera Эконометрика. Не мог обойти этот волшебный курс стороной…

Дмитрий Забавин @dmitry_zabavin:
📺 YouTube-канал StatQuest with Josh Starmer. Основы статистики и алгоритмов машинного обучения в очень простой форме и с подробными пошаговыми иллюстрациями.
📚 Книга Джоэл Грас, Data Science. Наука о данных с нуля. Подробный разбор основных алгоритмов машинного обучения с примерами того, как можно было бы эти алгоритмы реализовать самостоятельно на Python: лучший способ понять "как это работает" и бесценный образец кода на Python.
📚 Книга Дж. Вандер Плас, Python для сложных задач. Наука о данных и машинное обучение. Для дальнейшего развития: обзор множества алгоритмов обработки данных и машинного обучения - с примерами использования наиболее распространенных библиотек.
📚 Книга Франсуа Шолле, Глубокое обучение на Python. Cамое понятное погружение в глубокое обучение.
Forwarded from Natalia Toganova
В этот четверг, 02 сентября в 21:00 МСК встречаемся в голосовом чате. Говорить будем о 🔥 подкастах 🔥, о необходимости публичности для компаний и отдельных специалистов.

Выпуск приурочен к запуску нашего подкаста "Дайте данных" на следующей неделе.

Вопросы и темы:
Какая идея стоит за подкастом?
Цели подкаста и творческая смелость
Помогает ли подкаст добиться бизнес целей?
На сколько необходимо присутствовать в публичном пространстве - в соцсетях и не только?

Спикеры
😎 Александр Головин, Автор подкаста КритМышь, сооснователь студии Две Дорожки
😎 Александр Бородин, GlowByte Advanced Analytics, Руководитель направления в финансах и рисках
😎 Ирина Мефедова, GlowByte, Менеджер по PR&Marketing
🧐 А также все желающие

Вести будет Наталья Тоганова, GlowByte Advanced Analytics, бизнес-аналитик

До связи!
Forwarded from Natalia Toganova
Обычно мы публикуем reading-list 📚 по теме предстоящей встречи. Но в этот раз это будет hearing-list 🎧.

Этот список весьма субъективен. Ниже ссылка на опросник, добавьте свои любимые подкасты, мы обработаем и сделаем публикацию после встречи.

💻ИТ, анализ и близкое к этому:
✔️IT-шниками не рождаются
✔️Запуск завтра
✔️Деньги любят техно
✔️Podlodka
✔️— ждем запуска Данные люди (есть одноименный чат)
✔️Data Framed
✔️Data Viz Today

💜Разное, связанное с работой, с наукой и на подумать о жизни:
✔️Так вышло
✔️Критмышь
✔️НОРМ
✔️Экономика на слух
✔️Work Life / Adam Grant

‼️Опрос https://forms.gle/S8ujfMwXQgfoFSEW9
Ура! Первый выпуск нашего подкаста 🔥Дайте Данных🔥 появился на основных платформах:
🎙 Яндекс Музыка
🎙 Apple Podcasts
Подписывайтесь и ставьте лайки и много звёздочек=)
Почти по всех крупных организациях выделены отдельные департаменты и подразделения с централизованной функцией анализа данных. Во многих компаниях происходят процессы цифровой трансформации, в рамках которых также планируется выделение функции анализа данных и Data Science в отдельное подразделение.

Решили собрать круглый стол и поделиться опытом как выстраивать процессы и внутри таких DS подразделений, и в части их взаимодействия с другими структурами внутри организаций.

Встречаемся в этот четверг, 9 сентября в ❗️19:00❗️ МСК голосовом чате и обсуждаем следующие вопросы:

Организационная структура подразделения DS, фиксированные команды по предметным областям или технологиям? Или полный agile и все занимаются всем и знают всё?
Как взаимодействовать с бизнес партнерами и бизнес заказчиками? Где находится роль бизнес аналитика: в DS, у заказчика, или у всех есть свои бизнес аналитики?
Какие вообще есть роли помимо Data Engineer, Data Scientist и ML Engineer в таких DS подразделениях?
Как организовать обмен опытом и знаниями внутри DS подразделения?
Зачем заниматься R&D и как организовать этот процесс?
Какова роль внешних консультантов и чем они могут помочь, помимо подготовки 500-страничных презентаций про цифровую трансформацию?))

Эксперты-спикеры:
😎 Мария Калашникова, Газпромбанк, Вице-президент, Начальник Департамента анализа данных и моделирования
😎 Ирина Голощапова, Лента, Head of Data Science
😎 Наиль Макуев, МТС, Менеджера продукта «Big Data МТС Банка»
😎 Алексей Чернобровов, Консультант по Data Science и монетизации данных
😎 Павел Снурницын, GlowByte, руководитель практики Advanced Analytics
На этой неделе коллеги из GlowByte Advanced Analytics участвуют в паре мероприятий, которые посвящены скорингу и кредитным рискам.

Обсуждение по этой теме в нашем войс чате устроим на следующей неделе, а пока информация:

1️⃣ Сегодня, 14 сентября в 18:30 МСК вебинар “ML/DS тренды в задачах управления кредитным риском”.

Спикеры:
😎 Евгений Степанов, Управляющий директор, Банк ФК Открытие, Data Science
😎 Александр Бородин, Руководитель направления аналитики и моделирования в финансах и рисках, GlowByte Advanced Analytics
😎 Алиса Пугачева, Бизнес-аналитик, эксперт по моделированию кредитных рисков, GlowByte Advanced Analytics

Детали и регистрация по ссылке.

2️⃣ А в четверг, 16 сентября Александр Бородин выступит на конференции Scoring Day X с докладом “Контролируемые эксперименты в скоринге и оценке риска: тренды и кейсы”.

Если вы там будете, подходите к нашему стенду!
А если не будете, то запись доклада должна появиться на следующей неделе, ссылку пришлём)
На этой неделе случилась накладка по теме планируемого голосового чата. Но мы все равно решили собраться и немного пооффтопить, а именно попробовать найти ответ на часто задаваемый нам вопрос: почему и зачем возникла идея собирать очередное сообщество по темам DS/ML? 🧐Также расскажем про наши планы на будущее, что еще мы хотим делать в рамках сообщества, и будем очень рады, если кто-то присоединиться к нашей дискуссии и выскажет пожелания и предложения по развитию NoML🚀

Ну и в целом видимо порассуждаем на более общие темы вокруг сообществ в принципе:
Зачем нужны сообщества?
Почему сообщества начали появляться в последние годы? Где мы были раньше?
Чего добиваются сообщества?
Что дают сообщества? И как они влияют на личное развитие?

Встречаемся сегодня, 16 сентября, в 21:00 МСК в голосовом чате.
В эту пятницу, 24 сентября будет онлайн конференция Yandex Scale 2021, посвященная сервисам платформы Yandex.Cloud.

Есть даже статья про треки и основные темы в виде интервью с ответственными за секции конференции: Польза, а не маркетинг. Почему стоит потратить время на конференцию Yandex Scale 2021.

А с участием команды GlowByte Advanced Analytics будет выступление про кейс использования ML сервисов Yandex.Cloud как для разработки, так и для применения моделей:
Рекомендательная система на базе DataSphere
​​😎Александр Арланов, БУРГЕР КИНГ
😎Алёна Дробышевская, Yandex.Cloud
😎Андрей Иванов, GlowByte Advanced Analytics

Полная программа и регистрация по ссылке. Пишут, что регистрация закроется 22 сентября.

P.S.: А в нашем голосовом чатике про облака поговорим в следующий четверг, 30 сентября) следите за анонсами!
Сори, оффтоп.
Немного квантовой механики и теории чисел в ленту:
📺 A. V. Ustinov, M. B. Skopenkov, Feynman Checkers: Number Theory in Quantum Electrodynamics.
Доклад был в рамках конференции по аналитической теории чисел памяти Виноградова, прошедшей в начале прошлой недели, захотелось с кем-то поделиться)

Первые 20-25 мин. - про постановку задачи, доступно всем, кто знает элементарный тервер, и имеет популярное представление о физике элементарных частиц. Потом минут 5-10 про общую идею доказательства, как раз методами аналитической теории чисел, но очень очень кратко, если кому-то вдруг интересно, за деталями точно в статью авторов:
📄 M. Skopenkov, A. Ustinov, Feynman checkers: towards algorithmic quantum theory.
Cнова сходили на конференцию про скоринг и кредитные риски, на этот раз Scoring Day. И решили продолжить обсуждать тренды в моделировании кредитных рисков, тем более что в прошлый раз успели затронуть далеко не все заявленные темы.

Вопросы, которые хотим обсудить в этот четрвег, можно разделить на два основных блока:

1️⃣ Модели и аналитика в скоринге
📌 Контролируемые эксперименты и A/B фреймворк в оценке кредитных рисков.
📌 Задачи математической оптимизации в скоринге.
📌 Особенности сегментации и кластеризации в контексте рисковых моделей.
📌 Скоринговые, маркетинговые и другие бизнес задач как часть общей парадигмы принятия оптимальных решений.

2️⃣ ModelOps & MLOps в контексте кредитных рисков
📌 Модельный риск, ключевые процессы для управления модельным риском.
📌 Современная Data&ML платформа как средство митигации модельного риска.
📌 Ну и скорее всего про мониторинг и валидацию поговорим еще раз

Встречаемся в четверг, 23 сентября в 21:00 МСК в голосовом чате. Присоединяйтесь!
Записи мероприятий про модели в кредитных рисках, прошедших на прошлой неделе.

📺 Вебинар:
Евгений Степанов, Александр Бородин, Алиса Пугачева - “ML/DS тренды в задачах управления кредитным риском”.
(В записи в начале 9 холостых минут, видимо кто-то подумал, что мелодия хорошая) правда мелодия минуту, потом 7 минут тишины…🤔)

📺 Выступление на конференции Scoring Day X:
Александр Бородин - “Контролируемые эксперименты в скоринге и оценке риска: тренды и кейсы”.
(А тут в начале первые 3 минуты какие-то проблемы с презентацией, можно промотать, а можно посмотреть как Саша выкручивается)))

Смотрите и приходите завтра в голосовой чат задавать вопросы спикерам!
Еще одна запись выступления с конференции Scoring Day, теперь про кейс построения MLOps платформы:
📺 Павел Николаев (Открытие), Лина Чуднова (Neoflex) - Внедрение общебанковской платформы MLOps в банке «Открытие». Experience and lessons learned
Павел Николаев также примет участие в нашей сегодняшней дискуссии😎
Подключайтесь к обсуждению!
По мнению Gartner, к 2022 году публичные облачные сервисы будут необходимы для 90% инноваций в области данных и аналитики.

Про то, почему облака - это данность, и поговорим с Алёной Дробышевской из Яндекс.Облака в этот четверг в нашем голосовом чате.

Более подробный анонс будет немного позже (а может быть и не будет, и так всё понятно))). А пока можно посмотреть запись трека ML&AI прошедшей на прошлой неделе конференции Yandex.Scale.
Облака
NoML Community
Тема Feature Store очень активно развивается, почувствовали острую необходимость снова поговорить и про FS и вообще про данные в DS и ML (что и как обсуждали в прошлый раз).

В этот четверг (7 октября) в 21:00 по Москве собираемся в голосовом чате и обсуждаем следующие вопросы:

Как выглядит процесс подготовки данных для ML, кто его основные участники? То есть снова о том, кто такие DE и MLE и чем они должны заниматься?=)
Область Feature Store сравнительно новая и находится на этапе становления, какими свойствами должен обладать FS? Какие задачи может решить FS, а какие нет?
Как Feature Store встраивается и в процесс построения решений на базе продвинутой аналитики и в платформу Data&ML?
Что делать? Пробовать решения на рынке или строить свое?

Подключайтесь и послушать и поговорить!
Коллеги из GlowByte Advanced Analytics описали свое видение технологии FS:
👊 Как поссорились Инженер и Ученый. Статья про данные для ML и FeatureStore

Читайте, ставьте лайки и подключайтесь в четверг обсуждать и задавать вопросы авторам:
😎 Ольге Корольковой и
😎 Сергею Абрамову

🐣🐓🤔
Дополнение к предыдущему списку решений Feature Store, за которыми активно следит команда GlowByte Advanced Analytics:
🔹Splice Machine
🔹Molecula FeatureBase
🔹Databricks Feature Store
🔹Google Vertex AI Feature Store

Кстати, я так и не понял, занимаются ли в Iterative.ai (кодовое слово DVC) разработкой решения класса Feature Store? Где-то мелькали какие-то такие заявления со ссылками вот на этот пост: MLOps startup Iterative.ai nabs $20M.

А с чем сталкивались вы? Пишите в комментариях, добавляйтесь в чат, если вас там вдруг нет, и приходите обсуждать в этот четверг🎙