Forwarded from Start Career in DS
Все материалы Start Career in DS в одном сборнике!
Не так давно я осознал, что постов в канале уже больше 150 и ориентироваться в них становиться непросто. Поэтому подготовил страничку на Notion, которая позволит быстро находить нужный вам пост.
Ключевые блоки, которые там есть:
- Для новичков (разобраться что такое DS)
- Составление резюме, поиск работы
- Вопросы с собеседований и тестовые задания, шпаргалки (CheatSheets) для подготовки
- Математика для DS (в большинстве своём Статистика)
- Python и базовые библиотеки
- SQL
- Алгоритмы (классические)
- Git
- Базовые алгоритмы ML
- Предобработка данных, отбор признаков
- Метрики, функции ошибки
- Курсы
- Визуализация, A/B тесты, Apache Spark
- Soft Skills
Ну и подписывайтесь на нас в tg и на Youtube чтобы не пропускать новые материалы :)
[Ссылка тут]
Не так давно я осознал, что постов в канале уже больше 150 и ориентироваться в них становиться непросто. Поэтому подготовил страничку на Notion, которая позволит быстро находить нужный вам пост.
Ключевые блоки, которые там есть:
- Для новичков (разобраться что такое DS)
- Составление резюме, поиск работы
- Вопросы с собеседований и тестовые задания, шпаргалки (CheatSheets) для подготовки
- Математика для DS (в большинстве своём Статистика)
- Python и базовые библиотеки
- SQL
- Алгоритмы (классические)
- Git
- Базовые алгоритмы ML
- Предобработка данных, отбор признаков
- Метрики, функции ошибки
- Курсы
- Визуализация, A/B тесты, Apache Spark
- Soft Skills
Ну и подписывайтесь на нас в tg и на Youtube чтобы не пропускать новые материалы :)
[Ссылка тут]
Roman`'s Notion on Notion
Start Career in DS: навигация по постам
Все записи кликабельны и ведут на соотвествующий пост.
В следующую среду, 22 декабря в 17:00 МСК у нас планируется второй семинар (второй - и вообще, и по теме оптимизации)).
😎 Максим Гончаров расскажет про комплексный подход к оптимизации товарного ассортимента.
Детали будут в понедельник.
😎 Максим Гончаров расскажет про комплексный подход к оптимизации товарного ассортимента.
Детали будут в понедельник.
В эту среду 22 декабря в 17:00 МСК собираемся на второй семинар NoML.
Докладывать будет 😎 Максим Гончаров, руководитель направления Supply Chain Intelligence, GlowByte Advanced Analytics.
План доклада:
📌 Оригинальный алгоритм оценки качества кластеризации товаров и магазинов
📌 Прогнозирование функции плотности вероятностного распределения спроса с учетом конкуренции товаров на pytorch
📌 Собственная реализация алгоритма последовательной линейной аппроксимации выпуклой нелинейной функции цели для целочисленной нелинейной оптимизации
📌 Прогнозирование продаж и оптимизация ассортимента при помощи двух проходов на одной нейросети
Пока не решили, будем продолжать заставлять работать Google Meet, или перейдем на Zoom. Ссылка для подключения будет ближе к делу.
Докладывать будет 😎 Максим Гончаров, руководитель направления Supply Chain Intelligence, GlowByte Advanced Analytics.
План доклада:
📌 Оригинальный алгоритм оценки качества кластеризации товаров и магазинов
📌 Прогнозирование функции плотности вероятностного распределения спроса с учетом конкуренции товаров на pytorch
📌 Собственная реализация алгоритма последовательной линейной аппроксимации выпуклой нелинейной функции цели для целочисленной нелинейной оптимизации
📌 Прогнозирование продаж и оптимизация ассортимента при помощи двух проходов на одной нейросети
Пока не решили, будем продолжать заставлять работать Google Meet, или перейдем на Zoom. Ссылка для подключения будет ближе к делу.
Forwarded from Machine Learning REPA (RU) (Mikhail Rozhkov)
1️⃣ Что вы думаете об MLOps, Feature Store и Model Performance Monitoring? Правильно, это всем надо! Команда DS & Big Data компании Lenta готова поделиться секретами и собственным опытом! Итак, приглашаем на 🔥 ML REPA Meetup #8: Продвинутая аналитика и опыт команды Big Data Ленты
🗓 Dates: 22 Декаябр 2021 ( 19:00 - 21:00 Moscow time)
✅ Голощапова Ирина, Head of Data Science, Lenta
✅ Юрченко Максим, Разрабочик, Big Data Lenta
✅ Аникин Иван, Team Lead ML Engineering, Big Data Lenta
✅ Петров Иван, ML Engineer, Big Data Lenta
📺 Format: Online, zoom
Регистрация: https://ml-repa.timepad.ru/event/1528739/
🗓 Dates: 22 Декаябр 2021 ( 19:00 - 21:00 Moscow time)
✅ Голощапова Ирина, Head of Data Science, Lenta
✅ Юрченко Максим, Разрабочик, Big Data Lenta
✅ Аникин Иван, Team Lead ML Engineering, Big Data Lenta
✅ Петров Иван, ML Engineer, Big Data Lenta
📺 Format: Online, zoom
Регистрация: https://ml-repa.timepad.ru/event/1528739/
ml-repa.timepad.ru
ML REPA Meetup #8: Продвинутая аналитика и опыт команды Big Data Ленты / События на TimePad.ru
Что вы думаете об MLOps, Feature Store и Model Performance Monitoring? Правильно, это всем надо! Команда DS & Big Data Lenta готова поделиться секретами и собственным опытом!
По теме нашего NoML митапа на следующей неделе, подборка статей из рассылки www.featurestore.org:
📌 Was 2021 the Year of Feature Stores?
Также напоминаю про регистрацию на митап)
📌 Was 2021 the Year of Feature Stores?
Также напоминаю про регистрацию на митап)
Напоминаем, что через 20 минут у нас начнется семинар, ссылка для подключения: meet.google.com/wgr-nsdd-aqe
Спасибо Максиму и спасибо всем кто пришел!
Запись семинара по ссылке.
Google meet мы так и не победили, качество опять не очень(
В следующий раз точно переходим в Zoom.
Кстати, у нас в какой-то момент появилась база знаний в Notion, там пока не то чтобы много информации, но в разделе Семинары можно найти список прошедших семинаров с ссылками на записи и материалами.
Запись семинара по ссылке.
Google meet мы так и не победили, качество опять не очень(
В следующий раз точно переходим в Zoom.
Кстати, у нас в какой-то момент появилась база знаний в Notion, там пока не то чтобы много информации, но в разделе Семинары можно найти список прошедших семинаров с ссылками на записи и материалами.
Вчера вспомнили, что на предыдущем семинаре был вопрос про сравнение движков выпуклой целочисленной оптимизации, обещали со всеми поделиться ссылками:
📄 Kronqvista J., Bernalb D.E., Lundellc A., Grossmann I.E., A Review and Comparison of Solvers for Convex MINLP, 2018
А также сравнение движков Couenne, Bonmin, SHOT с MIDACO:
📄 Schlüter M., Gerdts M., Rückmann J.J., A Numerical Study of MIDACO on 100 MINLP Benchmarks, 2012
📄 Kronqvista J., Bernalb D.E., Lundellc A., Grossmann I.E., A Review and Comparison of Solvers for Convex MINLP, 2018
А также сравнение движков Couenne, Bonmin, SHOT с MIDACO:
📄 Schlüter M., Gerdts M., Rückmann J.J., A Numerical Study of MIDACO on 100 MINLP Benchmarks, 2012
Про трудности с развитием и финансированием проектов COIN-OR (опенсорсные оптимизационные движки и солверы Cbc, Clp, Ipopt):
‼️ Future of COIN-OR
Спасибо @epoepo за наводку на пост)
Кстати для тех, кто вдруг только подписан на канал, напоминаем, что еще есть чатик, в котором можно задавать вопросы про ML, DS и решаемые ими бизнес задачи)
‼️ Future of COIN-OR
Спасибо @epoepo за наводку на пост)
Кстати для тех, кто вдруг только подписан на канал, напоминаем, что еще есть чатик, в котором можно задавать вопросы про ML, DS и решаемые ими бизнес задачи)
Наш митап пройдет в пространстве Exposed. Внезапно оказалось, что это галерея, в которой сейчас проходит выставка художника Павла Шаппо. Так что, если даже тема Feature Store вам не очень близка, все равно регистриуйтесь и приходите, устроим круглый стол про современное искусство))
Информация про митап завтра.
Адрес: ул. Шаболовка 31Г, пространство Exposed.
Для тех кто своим ходом: от метро налево, через дорогу (3 минуты пешком), говорят розовую штуку на картинке видно прямо от метро.
Для тех кто на машине: с парковкой все грустно, отдельной парковки нет, только городская, пожалуйста учитывайте это при планировании маршрута и времени.
На странице мероприятия регистрация закрыта.
Если очень хотите дойти очно, пишите в личку @psnurnitsyn.
Если планируете смотреть онлайн, трансляция будет в нашем канале. Ссылка непосредственно на трансляцию будет в канале завтра ближе к делу.
Адрес: ул. Шаболовка 31Г, пространство Exposed.
Для тех кто своим ходом: от метро налево, через дорогу (3 минуты пешком), говорят розовую штуку на картинке видно прямо от метро.
Для тех кто на машине: с парковкой все грустно, отдельной парковки нет, только городская, пожалуйста учитывайте это при планировании маршрута и времени.
На странице мероприятия регистрация закрыта.
Если очень хотите дойти очно, пишите в личку @psnurnitsyn.
Если планируете смотреть онлайн, трансляция будет в нашем канале. Ссылка непосредственно на трансляцию будет в канале завтра ближе к делу.
Финальный в этом сезоне выпуск подкаста Дайте Данных появился на всех основных площадках.
😎 Александр Бородин сам у себя в гостях))
📌 Anchor
📌 Яндекс Музыка
📌 Apple Podcasts
📌 YouTube
😎 Александр Бородин сам у себя в гостях))
📌 Anchor
📌 Яндекс Музыка
📌 Apple Podcasts
📌 YouTube
Spotify for Podcasters
Get to know Spotify for Podcasters, the free, all-in-one podcast platform for every creator.
Хотел придумать термин Metric Store, но оказалось все уже придумали)
📌 A brief history of the metrics store
Нужно больше Store'ов))
📌 A brief history of the metrics store
Нужно больше Store'ов))
Medium
A brief history of the metrics store
How an in-house data product became the next hot data tool
Итак, финальный вариант программы митапа на сегодня
🖼 17:30 - 18:00 Сбор гостей
🎅 18:00 - 18:40 Сергей Ярымов, МТС Big Data, Опыт построения корпоративного Feature Store
🎅 18:40 - 19:30 Иван Аникин и Иван Петров, Big Data Lenta, FeatureStore - больше, чем просто фичи
🎅 19:30 - 20:00 Павел Снурницын, kolmogorov ai, Не склад, но магазин: будущее технологий Feature Store
🥂 20:00 - 22:00 Фуршет и свободное общение
Для тех кто онлайн, ссылка на трансляцию: https://www.youtube.com/watch?v=ZSWYdnl2xpM
🖼 17:30 - 18:00 Сбор гостей
🎅 18:00 - 18:40 Сергей Ярымов, МТС Big Data, Опыт построения корпоративного Feature Store
🎅 18:40 - 19:30 Иван Аникин и Иван Петров, Big Data Lenta, FeatureStore - больше, чем просто фичи
🎅 19:30 - 20:00 Павел Снурницын, kolmogorov ai, Не склад, но магазин: будущее технологий Feature Store
🥂 20:00 - 22:00 Фуршет и свободное общение
Для тех кто онлайн, ссылка на трансляцию: https://www.youtube.com/watch?v=ZSWYdnl2xpM
Материалы прошедшего митапа по Feature Store можно найти в нашей базе знаний в Notion.
Также записи отдельных выступлений:
😎 Сергей Ярымов, МТС Big Data, Опыт построения корпоративного Feature Store
😎 Иван Аникин и Иван Петров, Big Data Lenta, FeatureStore - больше, чем просто фичи
😎 Павел Снурницын, kolmogorov ai, Не склад, но магазин: будущее технологий Feature Store
Еще раз большой спасибо спикерам и всем кто был с нами!
Также записи отдельных выступлений:
😎 Сергей Ярымов, МТС Big Data, Опыт построения корпоративного Feature Store
😎 Иван Аникин и Иван Петров, Big Data Lenta, FeatureStore - больше, чем просто фичи
😎 Павел Снурницын, kolmogorov ai, Не склад, но магазин: будущее технологий Feature Store
Еще раз большой спасибо спикерам и всем кто был с нами!
☃️☃️☃️Зимняя подборка подкастов о data science на русском ☃️☃️☃️
На русском все чаще говорят о данных. Назовем основные. Не все они сейчас активно обновляются, но записанные выпуски интересны.
❄️Запуск завтра - это один из самых популярных подкастов про ИТ в русском сегменте. Порой там затрагиваются и большие данные.
❄️Podlodka Podcast - также подкаст, в котором в основном ИТ, но есть и про данные.
❄️Хабр Подкасты - название говорит за себя - подкаст сообщества.
❄️Большая дата - подкаст о данных компании Билайн.
❄️IT-шниками не рождаются - подкаст от Karpov Courses и поэтому основная тема - это как попасть в профессию.
❄️ S++ - подкаст Сбербанка о данных, в котором можно познакомиться с тем, как в крупнейшем банке страны работают с данными.
❄️ Данные люди - подкаст о людях, которые занимаются аналитикой данных. Не секрет, что подкаст ассоциирован с Мегафоном.
Да, не забывайте, что есть еще наш подкаст - Дайте данных - который на каникулах до конца февраля. Но пока можно прослушать, все что не успели в прошлом году.
Если у вас есть любимый подкаст и мы его не упомянули - поделитесь ссылкой!
На русском все чаще говорят о данных. Назовем основные. Не все они сейчас активно обновляются, но записанные выпуски интересны.
❄️Запуск завтра - это один из самых популярных подкастов про ИТ в русском сегменте. Порой там затрагиваются и большие данные.
❄️Podlodka Podcast - также подкаст, в котором в основном ИТ, но есть и про данные.
❄️Хабр Подкасты - название говорит за себя - подкаст сообщества.
❄️Большая дата - подкаст о данных компании Билайн.
❄️IT-шниками не рождаются - подкаст от Karpov Courses и поэтому основная тема - это как попасть в профессию.
❄️ S++ - подкаст Сбербанка о данных, в котором можно познакомиться с тем, как в крупнейшем банке страны работают с данными.
❄️ Данные люди - подкаст о людях, которые занимаются аналитикой данных. Не секрет, что подкаст ассоциирован с Мегафоном.
Да, не забывайте, что есть еще наш подкаст - Дайте данных - который на каникулах до конца февраля. Но пока можно прослушать, все что не успели в прошлом году.
Если у вас есть любимый подкаст и мы его не упомянули - поделитесь ссылкой!
❄️❄️❄️Зимняя подборка подкастов о data science на английском ❄️❄️❄️
🎄Data Sceptic - говорят, что это один из самых известных подкастов об аналитике и ds.
🎄DataFramed - подкаст от образовательной платформы DataCamp.
🎄Gradient Dissent - подкаст преимущественно о deep-learning.
🎄Harvard Data Science Review Podcast - рассматривают более прикладной аспект аналитики.
🎄Towards Data Science - подкаст спонсируемый блогом TDS Medium.
🎄Data Cast - подкаст о карьере в области аналитики данных и ds.
🎄Data Viz Today - подкаст о визуализации данных.
Это далеко не все подкасты, в которых увлекательно и по делу говорят об аналитике, ds и ml.
🎄Data Sceptic - говорят, что это один из самых известных подкастов об аналитике и ds.
🎄DataFramed - подкаст от образовательной платформы DataCamp.
🎄Gradient Dissent - подкаст преимущественно о deep-learning.
🎄Harvard Data Science Review Podcast - рассматривают более прикладной аспект аналитики.
🎄Towards Data Science - подкаст спонсируемый блогом TDS Medium.
🎄Data Cast - подкаст о карьере в области аналитики данных и ds.
🎄Data Viz Today - подкаст о визуализации данных.
Это далеко не все подкасты, в которых увлекательно и по делу говорят об аналитике, ds и ml.
☃️ Возвращаемся в рабочие будни и начинаем год NoML с очередного семинара. Продолжаем исследовать тему применения методов математической оптимизации в различных бизнес задачах.
А именно, в следующую среду 19 января в 17:00 МСК
😎 Вазген Амбарцумов, старший аналитик, GlowByte Advanced Analytics
расскажет про
🚀 Машинное обучение в банковском ценообразовании: VBP
📌Аннотация:
Современные банки накапливают и агрегируют данные о пользователях и своем взаимодействии с ними. Изучая эти данные, они могут лучше понимать потребности отдельного клиента и узнать, готов ли он воспользоваться тем или иным банковским продуктом. Это позволяет банку взаимодействовать с клиентом более точечно и быть более гибким в формировании стоимости продукта для различных сегментов и различных клиентов. На семинаре расскажем, как машинное обучение и математическая оптимизация могут помочь решать эту задачу.
А именно, в следующую среду 19 января в 17:00 МСК
😎 Вазген Амбарцумов, старший аналитик, GlowByte Advanced Analytics
расскажет про
🚀 Машинное обучение в банковском ценообразовании: VBP
📌Аннотация:
Современные банки накапливают и агрегируют данные о пользователях и своем взаимодействии с ними. Изучая эти данные, они могут лучше понимать потребности отдельного клиента и узнать, готов ли он воспользоваться тем или иным банковским продуктом. Это позволяет банку взаимодействовать с клиентом более точечно и быть более гибким в формировании стоимости продукта для различных сегментов и различных клиентов. На семинаре расскажем, как машинное обучение и математическая оптимизация могут помочь решать эту задачу.
Итак, напоминаем что завтра, 19 января, 17:00 МСК собираемся на семинар NoML.
Докладывать будет
😎 Вазген Амбарцумов, старший аналитик, GlowByte Advanced Analytics
В докладе будут рассмотрены следующие вопросы:
📌 Постановка бизнес-задачи ценообразования банковских продуктов
📌 Подход VBP (Value Based Pricing)
📌 Проверка гипотез и A/B тестирование в задачах VBP
📌 Постановка задачи машинного обучения (градиентный бустинг)
📌 Варианты постановки задачи оптимизации при разных бизнес ограничениях
Ссылка для подключения через Google Meet
Запись будет доступна на нашем канале YouTube
Докладывать будет
😎 Вазген Амбарцумов, старший аналитик, GlowByte Advanced Analytics
В докладе будут рассмотрены следующие вопросы:
📌 Постановка бизнес-задачи ценообразования банковских продуктов
📌 Подход VBP (Value Based Pricing)
📌 Проверка гипотез и A/B тестирование в задачах VBP
📌 Постановка задачи машинного обучения (градиентный бустинг)
📌 Варианты постановки задачи оптимизации при разных бизнес ограничениях
Ссылка для подключения через Google Meet
Запись будет доступна на нашем канале YouTube
А перед семинаром можно почитать статью коллег)
https://habr.com/ru/company/glowbyte/blog/646093/
https://habr.com/ru/company/glowbyte/blog/646093/
Хабр
Машинное обучение в банковском ценообразовании. VBP
Привет, Хабр! Современные банки накапливают и агрегируют данные о пользователях и своем взаимодействии с ними. Это помогает им лучше понимать потребности отдельного клиента и его склонность к...