МИСиС | Наука о данных
467 subscribers
27 photos
6 videos
24 files
113 links
Канал с новостями для студентов и абитуриентов программы SkillFactory и МИСиС «Наука о данных»

Помогаем освойть самую востребованную профессию 2022 года, учим понимать ключевые принципы и алгоритмы анализа данных.

Подробнее — http://bit.do/ds-sf
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
📌 Учебный год для наших студентов в самом разгаре, а пока предлагаем вам посетить бесплатный карьерный митап от нашего партнера SkillFactory, который пройдет сегодня в 20:00 по Москве 🕖

"С нуля до PRO в аналитике данных: чему и как учиться, чтобы быстрее расти в карьере"

Ссылка на мероприятие👇🏻
https://skillfactory.ru/analytics_grades
This media is not supported in your browser
VIEW IN TELEGRAM
📌Добрый день!

Недавно для студентов магистратуры прошёл семинар в формате Q&A, на котором Эмиль Магеррамов (руководитель отдела вычислительной химии в компании Biocad, сооснователь и старший дата-сайентист в компании EORA) ответил на вопросы студентов.  
Решили поделиться одними из самых интересных🙂
 
«Как выглядит день ds специалиста?»
 
 👉🏻С коллегами встречаемся днём на стендапе (встреча на 15 минут, где каждый по очереди рассказывает: что мы сделали вчера, что мы будем делать сегодня и какие у нас проблемы), предварительно изучаю актуальные новости по нашей теме (модели машинного обучения, новые алгоритмы и новые приёмы машинного обучения). Просматриваю и выбираю то, что мне кажется интересным и полезным для нашей работы и думаю о том, как это применить в моей текущей задаче.
  
«Какие разделы математики нужно знать дата сайентисту и как глубоко?»
 
👉🏻Всё зависит от того, в какую сторону вы хотите пойти в ds. Если вы хотите сами придумывать алгоритмы машинного обучения, то вам придётся изучить все разделы математики. Для тех, кто сильно хочет углубиться в математику, советую книгу👇🏻
https://mathematical-tours.github.io/book/ 

👉🏻Если вы хотите изучать модели и решать бизнес-задачи, то вам прежде всего нужно понимать теорию вероятности и математическую статистику, а также, что такое производная и градиент. 
👉🏻Еще нужно понимать разделы из линейной алгебры, чтобы понимать, что такое векторы, матрицы, разложения.
  
«Какая польза различных мероприятий, митапов для начинающего дата сайентиста?»
 
 👉🏻Я считаю, что польза огромная. В особенности советую хакатоны. Во-первых — это хороший способ узнать, что вообще сейчас в тренде и что происходит в индустрии. Во-вторых — отличный способ узнать новых интересных и полезных людей.
  
«Насколько сфера DS универсальна и международна? Образование в России позволит свободно работать в зарубежной компании или есть какие-то адаптации стилей?»
 
👉🏻Я работал в зарубежной компании, как дата сайентист и у меня не было абсолютно никаких проблем. По опыту моих знакомых точно так же. Data science — очень универсальная сфера.
This media is not supported in your browser
VIEW IN TELEGRAM
📌Каждую неделю для студентов нашей магистратуры проходят вебинары в формате Q&A по пройденным модулям.
 
В эту субботу, мы решили добавить новый формат семинарских занятий — Сoding Stream🧑‍💻

Во время семинара Сoding Stream Эмиль Магеррамов в режиме screen sharing будет решать задачу по сбору и анализу данных, продемонстрирует и прокомментирует особенности использования отдельных модулей и библиотек языка программирования Python.
 
Работать будут студенты с данными по COVID-19🦠:
 
👉🏻Посчитают скользящее среднее (прямо на реальных данных)
👉🏻Поищут корреляции со средним возрастом и долей курящих людей
👉🏻Найдут выбросы (отрицательные приросты, отсутствующие значения)
👉🏻Подвергнут анализу данные по первым дням: от первого заражения до 1 тыс. случаев
👉🏻Отсортируют страны по времени достижения первых 1 тыс. случаев
This media is not supported in your browser
VIEW IN TELEGRAM
📌Добрый день!

Хотим поделиться с вами интересным исследованием на тему: "Future of Jobs: спрос вакансий в области науки о данных "

В рамках исследования Future of Jobs от World Economic Forum были опрошены главные сотрудники отделов кадров и другие руководители бизнесов.

👉🏻Полученные результаты свидетельствуют об актуальности науки о данных.

👉🏻В приводимой таблице показан порядок ранжирования различных отраслей, в которых востребованы специалисты по ИИ и МЛ, дата аналитики и дата саентисты:

• Автомобильная промышленность
• Аэрокосмическая промышленность
• Управление цепями поставок и транспортная авиация
• Путешествия и туризм
• Химия
• Биотехнологии
• Энергетика и технологии
• Финансовые услуги и инвесторы
• Здравоохранение
• Инфраструктура информационно-коммуникационных технологий
• Добыча полезных ископаемых и металлов
• Нефть и газ
• Профессиональные услуги

P.S. Чем больше цифра в таблице, тем менее актуальны данные профессии в индустрии.
This media is not supported in your browser
VIEW IN TELEGRAM
📌 Продолжаем рассказывать вам о событиях онлайн-магистратуры🙂
 
Уже на следующей неделе наши студенты поучаствуют в первом хакатоне (дататон) онлайн-магистратуры "Наука о данных".
 
Почему "дататон"? Всё просто — студентам нужно выдвинуть проблему из любой интересующей их области и найти способ решения с помощью собранного data set.
 
Хакатон (дататон) — это уникальное мероприятие, в рамках которого можно реализовать идею из "ничего" за несколько дней и получить моментальный фидбэк о своей работе от эксперта в области (менторы), а также пополнить своё портфолио первым проектом.
 
Какие навыки прокачиваются во время хакатона?

🔹 Навык командной работы, в стрессовой ситуации
🔹 Тайм-менеджмент
🔹 Навыки презентации своей работы
🔹 Навыки product и project менеджмента в IT-проектах.
 
Теперь подробнее о структуре дататона🤖
 
6️⃣ дней упорной работы в команде с несколькими чек-поинтами:
 
Первый день — определение состава команды и идей, одна из которых будет реализована;
Второй и третий день — распределение задач и работа над прототипом проекта;
Четвертый и пятый день — подготовка MVP проекта и передача ссылки на GitHub;
Шестой день — защита собранных датасетов в рамках Demo day, выполненный проект оценивается менторами из индустрии и командами. Лучшие команды попадут в финал!
 
Прохождение каждого чек-поинта будет оцениваться баллами по сумме которых команды могут попасть в финал! 🏆

Желаем нашим студентам плодотворной работы! 🙂
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
📌Добрый день!
Рубрика «События онлайн-магистратуры» продолжается 🙂

В прошлую субботу завершился первый хакатон магистратуры «Наука о данных»🤖
(рассказывали подробно в предыдущем посте)

Напомним, что суть хакатона была в том, чтобы собрать data set на тему, которую выбрали сами студенты.

На линию старта вышли 18 команд, из которых все 18 команд дошли до полуфинала! 🤩
Команды делились на потоки, в каждом из которых два практикующих специалиста из области оценивали работы студентов. Менторы серьёзно подошли к оцениванию проектов и задавали много уточняющих вопросов. 

В финале встретились четыре команды! 🏁
После оценивания менторами работ финалистов мы узнали команду-победителя и услышали обратную связь от собравшихся экспертов отрасли.

Одно из ключевых отличий проекта-победителя, которое отметили менторы — это возможность реализации в бизнесе и получение прибыли👆🏻

О проекте-победителе мы расскажем вам в следующем посте 😉
This media is not supported in your browser
VIEW IN TELEGRAM
📌Добрый день!

Рассказываем о проекте, который стал победителем хакатона🥁
 
Но, прежде чем рассказать о проекте-победителе выясним по каким критериям выставлялись оценки работам команд:
 
✔️ Актуальность собранного датасета
✔️ Размеры датасета
✔️ Точность
✔️ Полнота
✔️ Качество документации к датасету
✔️ Презентация датасета командой
 
По результатам оценок менторов победителем хакатона стала команда "Data SkyScrapers" со своим проектом — Торговые точки вблизи транспортно-посадочных узлов (ТПУ), г.Москва
 
👆🏻Проект способен привлечь внимание специалистов в области недвижимости, благодаря работе команды можно выявить наиболее выгодное положение торговых объектов относительно ТПУ, тем самым позволить грамотно выбрать месторасположение новой торговой точки с учётом таких факторов как: 

🔹 данные о стоимости коммерческой недвижимости в районе объекта
🔹 демографические и географические данные о районе объекта
🔹 данные о зоне охвата объекта
 
Академический директор программы Иван Ямщиков поздравил победителей и поговорил на различные темы в рамках неформальной встречи с командой-победителем🏅
This media is not supported in your browser
VIEW IN TELEGRAM
📌Добрый день!
Завершающий пост про хакатон🤖

Рассказываем о менторах, которые приняли участие в хакатоне и делимся их впечатлениями.
 
🧑‍💻 Менторы — это специалисты из области применения DS.

У нас участвовали:

◾️ Виктория Богина, Data Scientist, компания Align Technology
◾️ Потапов Андрей, R&D engineer, Intellivision
◾️ Шмидт Кирилл, senior product analyst, Wrike
◾️ Николай Толстов, ДС тимлид, Мерлин АИ
◾️ Сиденко Андрей, Ведущий веб контент аналитик, Лаборатория Касперского
◾️ Владимир Суворов, Big Data and AI consultant, Auriga
◾️ Евгений Цымбалов, исследователь, Huawei
 
Все оценивающие отметили качество идей и реализацию проектов команд-финалистов.

👆🏻А также мы попросили менторов дать отзыв о самом мероприятии и вот некоторые из них: 

◽️ «Очень здорово, что у ребят возникло так много идей, и что они смогли эти идеи реализовать за достаточно короткий срок»

◽️ «Я как бывший выпускник магистратуры, но другой — тоже по анализу данных, хочу сказать, что у вас очень хорошая магистратура. В нашей магистратуре таких коллективных мероприятий не было, а идея действительно очень классная!»

◽️«Командная работа — это хорошо. Люди знакомятся, делятся опытом. Часто такие знакомства остаются на долгое время. Я бы сам в таком участвовал:)»
This media is not supported in your browser
VIEW IN TELEGRAM
📌Добрый день!

На прошлой неделе студенты магистратуры «Наука о данных» приступили к изучению одной из важных дисциплин для любого data sсientist.

⚙️Высшая математика и алгоритмы машинного обучения⚙️

👆🏻Дисциплины взаимосвязаны и реализованы в процессе обучения — последовательно, от базовых основ математического анализа и теории вероятности к теории машинного обучения, обработки данных, бустингу и кластеризации.

💻Кроме изучения текстовых материалов и выполнения заданий по ним, студенты посещают теоретические вебинары, вебинары с разбором задач по темам, групповые семинары по решению задач и решают блок задач в командах, соблюдая 2-недельный дедлайн.

В рамках этой дисциплины студенты узнают:

◾️Какие задачи решает Machine Learning.
◾️Через какие этапы проходит решение любой такой задачи
◾️Закрепят тему «Предобработка данных» в контексте Machine Learning: работа с пропусками, Feature Engineering, визуализация данных и поиск выбросов.
◾️Научатся корректно использовать такие понятия, как вектор, базис, оператор, матрицы.
◾️Смогут оперировать основными инструментами для решения и анализа задач линейной алгебры.
◾️И даже использовать матрицы для решения задач и представления окружающего мира!
This media is not supported in your browser
VIEW IN TELEGRAM
В нашей магистратуре “Наука о данных” НИТУ МИСиС, как оказалось, легко могут встретиться:

🚑 38-летний бывший врач-реаниматолог, который работал на “скорой”, но со школьной скамьи мечтал обучать машины

💻 25-летний программист, который мечтает работать с нейроинтерфейсами и попасть в компанию к Илону Маску

💃40-летняя студентка из Испании, которая хочет внести свой вклад в мировой прогресс, а толчком для изучения IT стала пандемия

Из какой сферы приходят в data science?
Кто они
будущие data scientists?
Как выбирают программу?
О чем мечтают?


И о том, какую роль сыграла пандемия, читайте в нашей статье 👉🏻 https://habr.com/ru/company/skillfactory/blog/527604/
This media is not supported in your browser
VIEW IN TELEGRAM