NoML Digest
1.88K subscribers
76 photos
1 video
2 files
603 links
База знаний https://noml.club
Чат https://t.me/noml_community
YouTube https://www.youtube.com/@NoML_community

По всем вопросам к @psnurnitsyn
Download Telegram
Forwarded from Start Career in DS
Все материалы Start Career in DS в одном сборнике!

Не так давно я осознал, что постов в канале уже больше 150 и ориентироваться в них становиться непросто. Поэтому подготовил страничку на Notion, которая позволит быстро находить нужный вам пост.

Ключевые блоки, которые там есть:
- Для новичков (разобраться что такое DS)
- Составление резюме, поиск работы
- Вопросы с собеседований и тестовые задания, шпаргалки (CheatSheets) для подготовки
- Математика для DS (в большинстве своём Статистика)
- Python и базовые библиотеки
- SQL
- Алгоритмы (классические)
- Git
- Базовые алгоритмы ML
- Предобработка данных, отбор признаков
- Метрики, функции ошибки
- Курсы
- Визуализация, A/B тесты, Apache Spark
- Soft Skills

Ну и подписывайтесь на нас в tg и на Youtube чтобы не пропускать новые материалы :)
[Ссылка тут]
В следующую среду, 22 декабря в 17:00 МСК у нас планируется второй семинар (второй - и вообще, и по теме оптимизации)).

😎 Максим Гончаров расскажет про комплексный подход к оптимизации товарного ассортимента.

Детали будут в понедельник.
В эту среду 22 декабря в 17:00 МСК собираемся на второй семинар NoML.

Докладывать будет 😎 Максим Гончаров, руководитель направления Supply Chain Intelligence, GlowByte Advanced Analytics.

План доклада:
📌 Оригинальный алгоритм оценки качества кластеризации товаров и магазинов
📌 Прогнозирование функции плотности вероятностного распределения спроса с учетом конкуренции товаров на pytorch
📌 Собственная реализация алгоритма последовательной линейной аппроксимации выпуклой нелинейной функции цели для целочисленной нелинейной оптимизации
📌 Прогнозирование продаж и оптимизация ассортимента при помощи двух проходов на одной нейросети

Пока не решили, будем продолжать заставлять работать Google Meet, или перейдем на Zoom. Ссылка для подключения будет ближе к делу.
Forwarded from Machine Learning REPA (RU) (Mikhail Rozhkov)
1️⃣ Что вы думаете об MLOps, Feature Store и Model Performance Monitoring? Правильно, это всем надо! Команда DS & Big Data компании Lenta готова поделиться секретами и собственным опытом! Итак, приглашаем на 🔥 ML REPA Meetup #8: Продвинутая аналитика и опыт команды Big Data Ленты

🗓 Dates: 22 Декаябр 2021 ( 19:00 - 21:00 Moscow time)
Голощапова Ирина, Head of Data Science, Lenta
Юрченко Максим, Разрабочик, Big Data Lenta
Аникин Иван, Team Lead ML Engineering, Big Data Lenta
Петров Иван, ML Engineer, Big Data Lenta
📺 Format: Online, zoom
Регистрация: ​​https://ml-repa.timepad.ru/event/1528739/
По теме нашего NoML митапа на следующей неделе, подборка статей из рассылки www.featurestore.org:
📌 Was 2021 the Year of Feature Stores?

Также напоминаю про регистрацию на митап)
Напоминаем, что через 20 минут у нас начнется семинар, ссылка для подключения: meet.google.com/wgr-nsdd-aqe
Спасибо Максиму и спасибо всем кто пришел!

Запись семинара по ссылке.
Google meet мы так и не победили, качество опять не очень(
В следующий раз точно переходим в Zoom.

Кстати, у нас в какой-то момент появилась база знаний в Notion, там пока не то чтобы много информации, но в разделе Семинары можно найти список прошедших семинаров с ссылками на записи и материалами.
Вчера вспомнили, что на предыдущем семинаре был вопрос про сравнение движков выпуклой целочисленной оптимизации, обещали со всеми поделиться ссылками:

📄 Kronqvista J., Bernalb D.E., Lundellc A., Grossmann I.E., A Review and Comparison of Solvers for Convex MINLP, 2018

А также сравнение движков Couenne, Bonmin, SHOT с MIDACO:
📄 Schlüter M., Gerdts M., Rückmann J.J., A Numerical Study of MIDACO on 100 MINLP Benchmarks, 2012
Про трудности с развитием и финансированием проектов COIN-OR (опенсорсные оптимизационные движки и солверы Cbc, Clp, Ipopt):
‼️ Future of COIN-OR

Спасибо @epoepo за наводку на пост)


Кстати для тех, кто вдруг только подписан на канал, напоминаем, что еще есть чатик, в котором можно задавать вопросы про ML, DS и решаемые ими бизнес задачи)
Наш митап пройдет в пространстве Exposed. Внезапно оказалось, что это галерея, в которой сейчас проходит выставка художника Павла Шаппо. Так что, если даже тема Feature Store вам не очень близка, все равно регистриуйтесь и приходите, устроим круглый стол про современное искусство))
Информация про митап завтра.

Адрес: ул. Шаболовка 31Г, пространство Exposed.

Для тех кто своим ходом: от метро налево, через дорогу (3 минуты пешком), говорят розовую штуку на картинке видно прямо от метро.

Для тех кто на машине: с парковкой все грустно, отдельной парковки нет, только городская, пожалуйста учитывайте это при планировании маршрута и времени.

На странице мероприятия регистрация закрыта.
Если очень хотите дойти очно, пишите в личку @psnurnitsyn.
Если планируете смотреть онлайн, трансляция будет в нашем канале. Ссылка непосредственно на трансляцию будет в канале завтра ближе к делу.
Финальный в этом сезоне выпуск подкаста Дайте Данных появился на всех основных площадках.
😎 Александр Бородин сам у себя в гостях))

📌 Anchor
📌 Яндекс Музыка
📌 Apple Podcasts
📌 YouTube
Хотел придумать термин Metric Store, но оказалось все уже придумали)
📌 A brief history of the metrics store

Нужно больше Store'ов))
Итак, финальный вариант программы митапа на сегодня

🖼 17:30 - 18:00 Сбор гостей
🎅 18:00 - 18:40 Сергей Ярымов, МТС Big Data, Опыт построения корпоративного Feature Store
🎅 18:40 - 19:30 Иван Аникин и Иван Петров, Big Data Lenta, FeatureStore - больше, чем просто фичи
🎅 19:30 - 20:00 Павел Снурницын, kolmogorov ai, Не склад, но магазин: будущее технологий Feature Store
🥂 20:00 - 22:00 Фуршет и свободное общение

Для тех кто онлайн, ссылка на трансляцию: https://www.youtube.com/watch?v=ZSWYdnl2xpM
Материалы прошедшего митапа по Feature Store можно найти в нашей базе знаний в Notion.

Также записи отдельных выступлений:
😎 Сергей Ярымов, МТС Big Data, Опыт построения корпоративного Feature Store
😎 Иван Аникин и Иван Петров, Big Data Lenta, FeatureStore - больше, чем просто фичи
😎 Павел Снурницын, kolmogorov ai, Не склад, но магазин: будущее технологий Feature Store

Еще раз большой спасибо спикерам и всем кто был с нами!
☃️☃️☃️Зимняя подборка подкастов о data science на русском ☃️☃️☃️
На русском все чаще говорят о данных. Назовем основные. Не все они сейчас активно обновляются, но записанные выпуски интересны.
❄️Запуск завтра - это один из самых популярных подкастов про ИТ в русском сегменте. Порой там затрагиваются и большие данные.
❄️Podlodka Podcast - также подкаст, в котором в основном ИТ, но есть и про данные.
❄️Хабр Подкасты - название говорит за себя - подкаст сообщества.
❄️Большая дата - подкаст о данных компании Билайн.
❄️IT-шниками не рождаются - подкаст от Karpov Courses и поэтому основная тема - это как попасть в профессию.
❄️ S++ - подкаст Сбербанка о данных, в котором можно познакомиться с тем, как в крупнейшем банке страны работают с данными.
❄️ Данные люди - подкаст о людях, которые занимаются аналитикой данных. Не секрет, что подкаст ассоциирован с Мегафоном.
Да, не забывайте, что есть еще наш подкаст - Дайте данных - который на каникулах до конца февраля. Но пока можно прослушать, все что не успели в прошлом году.
Если у вас есть любимый подкаст и мы его не упомянули - поделитесь ссылкой!
❄️❄️❄️Зимняя подборка подкастов о data science на английском ❄️❄️❄️
🎄Data Sceptic - говорят, что это один из самых известных подкастов об аналитике и ds.
🎄DataFramed - подкаст от образовательной платформы DataCamp.
🎄Gradient Dissent - подкаст преимущественно о deep-learning.
🎄Harvard Data Science Review Podcast - рассматривают более прикладной аспект аналитики.
🎄Towards Data Science - подкаст спонсируемый блогом TDS Medium.
🎄Data Cast - подкаст о карьере в области аналитики данных и ds.
🎄Data Viz Today - подкаст о визуализации данных.
Это далеко не все подкасты, в которых увлекательно и по делу говорят об аналитике, ds и ml.
☃️ Возвращаемся в рабочие будни и начинаем год NoML с очередного семинара. Продолжаем исследовать тему применения методов математической оптимизации в различных бизнес задачах.

А именно, в следующую среду 19 января в 17:00 МСК
😎 Вазген Амбарцумов, старший аналитик, GlowByte Advanced Analytics
расскажет про
🚀 Машинное обучение в банковском ценообразовании: VBP

📌Аннотация:
Современные банки накапливают и агрегируют данные о пользователях и своем взаимодействии с ними. Изучая эти данные, они могут лучше понимать потребности отдельного клиента и узнать, готов ли он воспользоваться тем или иным банковским продуктом. Это позволяет банку взаимодействовать с клиентом более точечно и быть более гибким в формировании стоимости продукта для различных сегментов и различных клиентов. На семинаре расскажем, как машинное обучение и математическая оптимизация могут помочь решать эту задачу.
Итак, напоминаем что завтра, 19 января, 17:00 МСК собираемся на семинар NoML.

Докладывать будет
😎 Вазген Амбарцумов, старший аналитик, GlowByte Advanced Analytics

В докладе будут рассмотрены следующие вопросы:
📌 Постановка бизнес-задачи ценообразования банковских продуктов
📌 Подход VBP (Value Based Pricing)
📌 Проверка гипотез и A/B тестирование в задачах VBP
📌 Постановка задачи машинного обучения (градиентный бустинг)
📌 Варианты постановки задачи оптимизации при разных бизнес ограничениях

Ссылка для подключения через Google Meet

Запись будет доступна на нашем канале YouTube