МИСиС | Наука о данных
462 subscribers
27 photos
6 videos
24 files
113 links
Канал с новостями для студентов и абитуриентов программы SkillFactory и МИСиС «Наука о данных»

Помогаем освойть самую востребованную профессию 2022 года, учим понимать ключевые принципы и алгоритмы анализа данных.

Подробнее — http://bit.do/ds-sf
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
📌Добрый вечер!
Сегодня расскажем вам о событиях в жизни магистратуры «Наука о данных» за эту неделю.

Подошла к концу первая сессия! Ура! 🥳
Наши студенты на шаг ближе к своей цели — освоить новую для себя профессию🎯

Напоминаю, что с 3 го семестра мы разделимся на три трека:

▫️Artificial Intelligence Developer
▫️Big Data Engineer
▫️Machine Learning Developer 
 
🛤Чтобы помочь студентам сделать правильный выбор на своем карьерном пути — мы организовали Q&A встречу по треку Big Data Engineer, с экспертом из индустрии — Виталием Худобахшевым (тимлид в Jet Brains, разработчик плагина Big Data Tools) 
 
Такие встречи пройдут по всем трём трекам, а пока делимся с вами некоторыми вопросами и ответами:

▪️Как выглядит рабочий день дата инженера, исключая совещания? Пришёл и что делает? Проверят всё ли живо и чинит или что-то пишет?

«Часто чинит и разгребает инциденты, которые довольно часты на практике. Чистит код, улучшает/добавляет pipeline. Условно говоря следит, чтобы всё не развалилось. Работа по входящим задачам от других отделов в пределах компетенции специалиста».

▪️Какие инструменты будут использоваться наибольшим образом? На каком уровне мы будем работать с этим?

«Apache Spark — очевидный лидер среди используемых инструментов, Hadoop — не понимать, как работает этот инструмент также нельзя (Spark работает поверх Hadoop, к примеру) и вся инфраструктура вокруг Hadoop важна для того, чтобы понимать, как кластера существуют. Hive важен для аналитики. DataGrip как самый продвинутый инструмент для работы с SQL, т. е. опять же к аналитике ближе. Koalos фреймворк для получения API Pandas, просто работающий поверх Apache Spark. Dask — фреймворк на чистом пайтоне, много времени изучение не должно занять, но и без него нельзя. Kafka — это продюсер большого количества контента, который после попадает в JDBC, Hadoop, а после попадает в Spark». 

▪️Будет ли возможность брать дисциплины из нескольких треков или нужно строго выбрать один?

«Такая возможность будет, но нужно чётко понимать, что объём будет довольно-таки большой».
This media is not supported in your browser
VIEW IN TELEGRAM
📌Добрый день!
Уже на следующей неделе начнется второй семестр магистратуры «Наука о данных».

Всего в семестре 4️⃣ дисциплины:

🔻Менеджмент для наук о данных

🔻Системы хранения и обработки данных

🔻Инжиниринг данных

🔻Глубокое обучение в науках о данных

Сегодня расскажем вам о самой первой дисциплине:


🔗Менеджмент для наук о данных🔗

Преподаватель и автор курса — Смирнова Ольга.
Профессионал с опытом управления проектами и продуктами в сфере IT и автоматизации финансовых и банковских услуг на протяжении 12 лет.
Опыт работы в таких компаниях, как: PROJECT TUNE, СКБ КОНТУР, WESTERN UNION CORPORATION.

Темы курса:

▪️IT в современном мире
▪️Оценка навыков и ресурсов
▪️Методологии управления проектами
▪️Начало работы над проектом
▪️Планирование проекта
▪️Сбор требований
▪️Гипотезы

После прохождения курса, студенты научатся:


▫️Составлять ТЗ
▫️Моделировать бизнес-процессы
▫️Проектировать ИС
▫️Оценивать навыки и ресурсы
▫️Строить план и дорожную карту проекта
▫️Проводить брифинг заказчика
▫️Собирать требования к продукту
▫️Применять такие модели, как: Waterfall и Agile
This media is not supported in your browser
VIEW IN TELEGRAM
📌Добрый день!
Продолжаем рассказывать о предметах второго семестра в магистратуре «Наука о данных».

Система хранения и обработки данных

Преподаватель курса — Конов Илья Сергеевич
Старший преподаватель кафедры АСУ, и.о. директора центра академии данных MADE НИТУ МИСиС. Сертифицированный тренер Huawei и Cisco по направлению R&S и Storage system.

Курс направлен на приобретение представлений об архитектуре и принципах функционирования систем хранения и обработки данных, о методах и подходах к защите данных. В рамках дисциплины разбираются принципы работы HDD и SSD дисков.
Рассказывается про RAID технологии, технологии защиты данных и основные протоколы хранения и передачи. Курс опирается на сертифицированные курсы Huawei BSSN Storage system.
Все лабораторные работы будут происходить на реальном энтерпрайз оборудовании.

👆В завершение каждый студент может пройти бесплатную инженерную сертификацию.


Компетенции студентов после прохождения предмета:

▪️Определения, термины и понятия в области хранения и обработки данных
▪️Подходы и методики создания отказоустойчивых систем хранения данных
▪️Проектирование систем хранения данных и работы с ними
▪️Коммутация, настройка и тестирование систем хранения и обработки данных
▪️Конфигурации современных систем хранения данных
▪️Проектирование конфигурации сетей исходя из параметров ТЗ
▪️Администрирование в Linux и Windows Server
▪️Базовые команды администрирования в Unix Shell
This media is not supported in your browser
VIEW IN TELEGRAM
📌Добрый вечер!
У нас вышла статья, в которой студенты делятся своим опытом сбора датасета в рамках учебного хакатона магистратуры «Наука о данных» 🤖

В материале описаны 3 датасета:

🔹Набор данных о вакансиях для поиска IT специалистов на сайте hh.ru

🔹Датасет с данными кошек различных пород

🔹Датасет с данными из Spotify и MusicBrainz о российских музыкальных исполнителях и их лучших треках

Переходите по ссылке 👉 https://habr.com/ru/company/skillfactory/blog/542004/

Уверены, вам будет интересно! 🙂
This media is not supported in your browser
VIEW IN TELEGRAM
📌Добрый день!
Продолжаем рассказывать о предметах второго семестра в магистратуре «Наука о данных».

🛠Инжиниринг данных🛠

Преподаватель курса — Троицкий Николай
Работал в таких компаниях, как: Техносерв, IBS, Сбербанк КИБ, Фонд Сколково и Интерфакс.
Сейчас занимается ИТ-консалтингом и руководит компанией «Бутик Информационных Технологий»

Курс состоит из модулей:

🔹Вводный модуль (Профессии в DS + Архитектура ПК)
🔹Тестирование
🔹Работа с файлами разных форматов
🔹Подготовка модели в Production
🔹Введение в SQL
🔹Агрегатные функции
🔹Связи таблиц
🔹Соединения таблиц
🔹Сложные объединения
🔹Практический Linux
🔹Системы визуализации и анализа
🔹Подзапросы
🔹Оконные функции
🔹NoSQL

В завершение курса, студенты научатся:

🔸Тестированию и отладке кода на Python
🔸Работать с файлами разных форматов
(не только CSV, но и Excel, JSON и XML)
🔸Понимать особенности доставки обученных моделей в продакшн
(различные способы применения моделей ML)
🔸SQL
🔸Операционная система Linux
This media is not supported in your browser
VIEW IN TELEGRAM
📌Добрый день!
Рубрика событий онлайн-магистратуры продолжается.

На прошлой неделе для наших магистрантов состоялась встреча с экспертом из области DS — Давидом Григорян.
Работает в компании Мегафон, занимается проектами по CVM (Customer value maximization).
Также к встрече присоединилась коллега Давида — HR-менеджер, Светлана Стаканова.

Цель встречи — рассказать о применении DS в телекоммуникациях и поделиться своим опытом.

Еще год назад Давид Григорян — был студентом магистратуры, а сейчас сотрудник ведущей компании в России.

Во время встречи студенты узнали:

С какими данными нужно работать
Как выглядит иерархия в команде,
Примеры проектов, типовые задачи, инструменты и как их освоить
Требования к профессии (на что смотрит работодатель при приеме на работу, как составить портфолио, реалии индустрии)

Кроме этого, успели задать вопросы приглашенным спикерам.
Делимся некоторыми из них:

Какой стек технологий вы точно требуете для стажеров и junior специалистов?
Топ 1,2,3 хард скилл для джуниора, кторый вы требуйте?

«Матан, лин.алгебра, питон. Начальные навыки по методам машинного обучения — всё что не дип ленинг джун должен знать.
1. Понимание статистики
2. Понимание матана и методов машинного обучения
3. Понимание питона»

Слышал такое мнение, что сейчас data science от узких специализаций движется в сторону "универсализации" специалистов, которые умеют и ml и de, всё действительно так?

«Да, и правда есть такое. Вполне нормальное картина, когда от ML Engineer требуется навыки работы с данными, со сбором их. Ровно, как и наоборот ситуация может повернуться.»

Насколько необходимо наличие портфолио для джуна? Достаточно ли пет-проджекта в виде телеграм-бота и небольшого ноутбука с анализом какого-нибудь датасета с кагла?

«Всё познаётся в сравнении. Если будет специалист с таким же стеком технологий, но с богатым гитхабом за плечами, то выбор будет в сторону богатого портфолио. Причины банальны — это опыт, на который будущий лид сможет опереться при составлении вопросов технического интервью.»
This media is not supported in your browser
VIEW IN TELEGRAM
📌Добрый день! У нас бомба-новость!💣💥

В прошлое воскресенье у нас прошел финал второго хакатона в магистратуре «Наука о данных».

В этот раз — Межгалактический хакатон 🪐

Рассказываем: Почему хакатон — межгалактический и что это вообще обозначает.

Чтобы было интереснее мы добавили идею известного произведения «Автостопом по галактике».🚀
По нашему мнению данные — это целая галактика.

🎯Миссия:
Студентам предстояло решить исследовательскую задачу с помощью анализа данных и/или машинного обучения.

Подтвердить или опровергнуть поставленную гипотезу, обучив модели и найдя закономерности в данных.

Мы предложили студентам выбрать один из двух треков:


🤖«Марвин» — те студенты, которые выбрали этот трек — решали задачи от наших партнеров на их датасетах. «Галактический путеводитель» дал подсказку — собирать данные в таком случае не обязательно, но обогащение имеющихся данных из открытых источников может быть полезным.

🧑«Артур» — этот трек для настоящих исследователей: здесь можно использовать набор данных с первого хакатона, к нему разработать исследовательскую идею, сформулировать гипотезу и проверить ее, а результаты представить менторам.

Затянуло в космос Data Science и наших партнеров, которые представили кейсы нашим студентам:

Кейс 1. — «Анализ схем севооборота» от DHVB
Кейс 2. — «Анализ данных для формирования состава» от РЖД
Кейс 3. — «Кластеризация изображений транспортных средств» от Intellivision
Кейс 4. — «Предсказание бойца победителя UFC» от ментора Николая Толстова, Data Science Teamlead, Merlin AI
Кейс 5. — «Формирование мультизаказов курьерской доставки»

Всего хакатон занял 5 дней. Все 5 дней студенты решали задачи, а также получили несколько дополнительных консультаций с партнерами в формате Q&A.

Также, перед выступлением финалистов хакатона, мы организовали «Музыкальную паузу». 🎵

Нашим специальным гостем стала — Аня Литомина из группы «Трипинадва», которая исполнила песни под гитару.🎸

Теперь рассказываем о финалистах нашего хакатона:

Команда «3 P’s» (кейс DVHB) — 1 место 🥇
Команда «Глубокое переобучение» (кейс UFC) — 2 место 🥈
Команда «Cloud 9» (кейс Intellivision) — 3 место 🥉

Предлагаем и вам частично погрузиться в наш межгалактический хакатон 👉🏻🚀 https://zavtra.online/hackathon
This media is not supported in your browser
VIEW IN TELEGRAM
Доброе утро! ☀️

Сегодня в 17:00 по Москве — состоится стрим «Высшее образование в онлайне» с Александром Турилиным CEO & Co-founder в SkillFactory.

🎓На стриме поговорим об онлайн-образовании в университетах, а так же на другие важные темы:

🔹Всем ли профессиям можно научиться в сети и заменит ли онлайн-образование классические формы обучения?

🔹Поменять профессию онлайн — реальность или маркетинговый ход? Как онлайн-школы помогают кандидатам найти новую работу?

🔹Какие возможности дает онлайн-образование для построения карьеры и развития экспертизы топ-менеджерам?

👉🏻Регистрация на мероприятие не нужна — просто нажмите кнопку «Пойду» на странице Facebook.
Вам придет уведомление о начале трансляции прямого эфира.

Также трансляция будет вестись на YouTube-канале.
This media is not supported in your browser
VIEW IN TELEGRAM
📌Добрый день!
Совместно с нашими студентами мы снова выпускаем ✍️серию статей.

Финалисты подробно рассказывают о своём опыте решения задач, в рамках «Межгалактического хакатона» в магистратуре «Наука о данных» НИТУ МИСиС 🛸

Переходите по ссылке, чтобы прочесть 👉🏻 https://habr.com/ru/company/skillfactory/blog/549754/
This media is not supported in your browser
VIEW IN TELEGRAM
📌Добрый день!

Как вы уже знаете, в нашей магистратуре — мы делаем основной упор на практику! 🛠

Чтобы студенты получали реальный опыт и обратную связь от экспертов, мы внедряем в образовательную программу актуальные кейсы компаний.

Так, кроме групповых практикум и хакатонов, мы добавили проектный практикум под названием «Решено».

Что из себя представляет «Решено»?

Это задачи от партнеров, над которыми студентыми будут работать в течение 8 недель.
Оценивать студентов и вести контроль качества будут работодатели.

Наши партнеры и кейсы на «Решено»:

🔹Агентство инноваций города Москвы
Кейс — разработка автоматизированного метода оценки для системы по анализу технологических трендов

🔹First Line Software
Кейс — построение модели для анализа распространения COVID-19 на основании открытых данных поисковых систем

🔹АО «НИИАС»
Кейс — прогнозирование зарождающегося вагонопотока