Клуб CDO
2.69K subscribers
329 photos
16 videos
81 files
1.34K links
Сообщество профессионалов в области работы с данными и искуственным интеллектом
Download Telegram
перепощу тут новость - если в России будут доступны все сервисы AWS - особенно связанные с построением хранилищ, работой с ML моделями и тд - это будет прям отлично!

Ну и нельзя не отметить, что для mail.ru это прям “ход конем” в ответ на яндекс.облако и гос облако сбербанка.
Amazon договорился о выходе на российский рынок в партнерстве с Mailru

Компании предложат клиентам единый доступ к облачным сервисам и решениям. Это позволит Amazon соблюдать законодательство о хранении персональных данных в России- до сих пор ближайший ее дата-центр был в Германии.

Mailru и Amazon запускают в России мультиклауд (облачная инфраструктура, построенная на решениях различных поставщиков), который позволит клиентам получить доступ к сервисам одновременно обеих компаний.

Прямые продажи услуг мировых облачных провайдеров в России ограниченны и составляют не более 8% рынка.

Весь рынок облачных услуг России в 2019 году составил ~ 86 млрд руб.
Вышел новый аналитический отчёт компании KMDA о состоянии цифровой трансформации российских компаний.

Крайне рекомендуется к изучению, не уверен, что нужно писать к нему комментарии, тк основные выводы приводятся в самом отчете, но если будут мысли по прочтении - обязательно тут поделюсь.
On-premise or cloud – where should you host your AI applications?

Статья на тему вечного спора на тему Cloud vs On-premise.

Какие аспекты следует учитывать при выборе?
⁃ Стоимость
⁃ Масштабируемость
⁃ Безопасность
⁃ Гравитацию данных

Если первые 3 пункта достаточно тривиальны (а детали можно прочитать в оригинальной статье), то на четвертом я бы остановился чуть подробнее. Гравитация данных означает, что часто стоимость доставки данных до обрабатывающего их приложения обходится дороже, чем развертывание приложения непосредственно там, где находится источник данных. Таким образом, именно источник данных определяет преимущества реализации ИИ-приложения в периметре или в облаке.

Ну и надо отметить, что выбор между облаком и местным хостингом - это не разовое решение. Это вопрос, который разработчики и бизнес-администраторы могут задать себе на разных этапах в течение жизненного цикла ИИ-приложения. Может возникнуть необходимость перехода с локальной обработки на облако или наоборот. Если бизнес находится на ранних стадиях цифровой трансформации, то "облако" будет лучшим вариантом с низкими затратами на эксперименты. А затем, оценивая требования приложений, предприятия могут при необходимости адаптироваться, изменять или масштабировать хостинг на on-premise.

Подробнее по ссылке: https://www.experfy.com/blog/on-premise-or-cloud-where-should-you-host-your-ai-applications/
Хорошая таксономия “стоимости качества данных”
Всем добрый день!
Напоминаем, что в ближайший четверг, 30 июля, у нас очередное онлайн мероприятие.

19:00-20:00 Денис Афанасьев, CEO CleverDATA и активный автор данного канала, будет выступать с темой «Внешние данные, кейсы. Методы безопасного обмена данными».

Ссылку для подключения к Zoom направим в четверг. Ставьте ивент в календарь, если раньше этого еще не сделали. Хорошего дня!
До встречи в 19:00 на выступлении Дениса Афанасьева, CEO CleverDATA, с темой «Внешние данные, кейсы. Методы безопасного обмена данными».

Ссылка для подключения https://us02web.zoom.us/j/87880614971
1DMx_Data_market.pdf
18.7 MB
Все привет и спасибо всем, что присоединился к трансляции! Как обещал, публикую презентацию, а записью поделимся чуть позже.
Всем добрый день! По ссылке ниже запись прошедшего на прошлой недели выступления Дениса Афанасьева в рамках Клуба CDO с темой «Внешние данные, кейсы. Методы безопасного обмена данными».
https://www.youtube.com/watch?v=8P0uZLP0CHE
Fueling growth through data monetization

Довольно свежие результаты исследования McKinsey на тему использования данных в задачах роста бизнеса.

Краткие выводы: продажи и маркетинг по использованию данных впереди всех, high tech индустрия использует данные в максимальном количестве кейсов, в оценке результата использования данных доминирует “moderate change” как оценка результата.

В основном компании с помощью данных равивают текущую продуктовую линейку, нежели создают фундаментально новые продукты.

С точки зрения организации структуры аналитического отдела у лидеров рынка доминирует гибридный подход, с единым центром экспертизы, но с выделенными под заказчиков ресурсами. А вот у отстающих вместо гибридной схемы используются либо полностью централизованный или полностью децентрализованный подходы.

Также интересно, что у лидеров рынка за данные отвечает непосредственно CEO (прям в сильно подавляющем количество случаев)

Подробности с красивыми гистограммами тут:
https://www.mckinsey.com/business-functions/mckinsey-analytics/our-insights/fueling-growth-through-data-monetization
Интересный кейс разворачивается вокруг противостояния Wheely и ДТ Москвы о передачи данных. ДТ хочет получать все данные о поездках в реальном времени. Похоже кроме кейса mail/doubledata, появиться новый пример спора о правовой принадлежности данных.

https://wheely.com/ru/debunking-mdots-anti-privacy-argument
За последнее десятилетие ИИ превратился в самую мифологизированную область прогресса, вокруг которой формируется новая техно-религия всезнания больших данных и всемогущества машинного обучения.
С каждым настоящим достижением в области ИИ мы наблюдаем параллельный рост шумихи, мифов, заблуждений и неточностей. Эти недоразумения способствуют непрозрачности систем ИИ, делая их в глазах общественности волшебными, непостижимыми и недоступными.
О новом проекте команды Даниэля Лойфера «Мифы об ИИ», цель которого помочь распутать и развенчать некоторые из этих вводящих в заблуждение идей, - в моем новом посте на 5 мин.
- на Medium http://bit.do/fHxvt
- на Яндекс Дзен https://clck.ru/QK3fS
#ИИ
Forwarded from Ivan Begtin (Ivan Begtin)
С января 2020 стартовал европейский проект TRUSTS [1] по созданию платформы торговли персональными и проприетарными данными с учётом всех правил и ограничений Евросоюза, включая GDPR. В проекте участвует консорциум из 17 организаций, академических, финансовых, стартапов в области данных, а Евросоюз выделил на него чуть менее 6 миллионов евро на 3 года [2].

Этот проект создан в рамках направления "Supporting the emergence of data markets and the data economy" [3] под которым в Евросоюзе создаются такие проекты как:
- Kraken Brokerage [4] платформа по защите персональных данных в облачных средах
- PIMCITY [5] повышение контроля пользователей за их данными собираемыми веб-сайтами
и многие другие проекты.

По моему опыту наблюдения за проектами в рамках Европейской исследовательской программы Horizon 2020 они редко превращаются в практические системы/стартапы/продукты, но очень часто прямо или косвенно влияют на выработку госполитики и регулирование в Евросоюзе.

Ссылки:
[1] https://www.trusts-data.eu/
[2] https://cordis.europa.eu/project/id/871481
[3] https://cordis.europa.eu/programme/id/H2020_ICT-13-2018-2019
[4] https://cordis.europa.eu/project/id/871473
[5] https://cordis.europa.eu/project/id/871370

#privacy #personaldata #eu
Всем добрый день!

Рады анонсировать следующее мероприятие (остаемся пока в онлайне).

2 сентября 19:00-20:30

Михаил Садофьев, Директор, Руководитель направления продвинутой аналитики Accenture в России

Тема: «Стратегия данных»

Особенности и факторы успеха при разработке стратегии данных. Примеры кейсов. Руководство по достижению целевого уровня зрелости организации.

Ставьте себе в календарь, чтобы не забыть. А ссылку пришлем ближе к мероприятию.
Progress…but more work ahead

Очень хороший заголовок для отчета о текущем состоянии AI в бизнесе, имхо максимально точно определяет текущее положение вещей.
Отчет подготовлен компанией KPMG и доступен по ссылке ниже.

Основные выводы по прочтению отчета такие:
⁃ две трети опрошенных считают, что внедрение технологии ИИ движется с соответствующей скоростью в их отрасли, но большинство респондентов все еще желают, чтобы их организации более активно внедряли технологию.
⁃ Менеджеры С-уровня значительно более позитивно оценивают готовность организаций к внедрению, чем менеджер среднего уровня
⁃ Большинство компаний ждут основную отдачу от AI в будущем, но и на текущий момент отмечают существенные выгоды от применения технологий
⁃ Существует большое различие в адаптации технологии между разными индустриями, внедрения идут неравномерно
⁃ Основная проблема адаптации технологий - недостаточное понимание возможностей технологии
⁃ Новый термин появился - “data literacy” - что еще раз подчеркивает необходимость массового обучения
⁃ Не такой уж и большой процент сотрудников считают AI угрозой для своих рабочих мест
⁃ Вопросы этики, безопасности и контроля данных и ИИ - первостепенные
⁃ Государственное регулирование ИИ сферы - неизбежно

https://advisory.kpmg.us/content/dam/advisory/en/pdfs/2020/living-in-ai-world.pdf
Сегодня хочу книгу порекоммендовать. Не так много книг по теме качества данных, ранее я писал про DMBOOK, а сегодня хочу отметить “Handbook of Data Quality” - очень полное руководство по методам обеспечения качества данных. Обзор походов, проблематики, вопросов организации и реализации.

Если кому нужна версия в электронном виде - обращайтесь.

https://www.goodreads.com/book/show/17301405-handbook-of-data-quality
Друзья, почему то не могу в комментариях поделиться ссылкой, поэтому, поскольку есть запросы на книгу, публикую ссылку тут: https://www.dropbox.com/s/94hgnf62zzsgch9/Sadiq2013-Handbook-of-Data-Quality.pdf?dl=0
Всем добрый вечер!

Напоминание:

2 сентября 19:00-20:30

Михаил Садофьев, Директор, Руководитель направления продвинутой аналитики Accenture в России

Тема: «Стратегия данных»

Особенности и факторы успеха при разработке стратегии данных. Примеры кейсов. Руководство по достижению целевого уровня зрелости организации.

Ссылка на Zoom будет здесь завтра.