Deep Dive 2 Deep Learning
382 subscribers
23 photos
4 videos
339 links
Канал про глубокое машинное обучение: кейсы, новости, открытия и факапы из мира нейросетей и не только
Download Telegram
🤖⚡️💡Аудио высокого качества теперь доступно всем
Сверхразрешение звука — это фундаментальная задача, позволяющая прогнозировать высокочастотные компоненты для звука низкого разрешения, улучшая качество звука в цифровых приложениях. Так, например, AudioSR — это AI-модель, которая может увеличить качество аудиозаписей, включая музыку, речь и звуковые эффекты, в диапазоне частот от 2 kHz до 48 kHz.
Необходимо просто отправить низкокачественный файл, и в итоге вы получите улучшенный результат — то же аудио, но с значительным улучшением.
🤖📊💡AI-репетитор по математике для детей
Synthesis — это новый ИИ-репетитор по математике. Сервис основан на обучающей технике Джеймса Тонтона — доктора математических наук Принстонского университета.
Стартап финансируется DARPA (Управлением перспективных исследовательских проектов Министерства обороны США) и состоит из трех курсов для детей разной возрастной категории.
Однако стоит отметить, что данный стартап призван обучать не только математике
Для детей предлагается 2 режима работы:
Synthesis Tutor - режим развития у ребенка математического мышления через различные задачи, генерируемые ИИ
Synthesis Teams - режим развития у детей навыков работать в команде, решая различные проблемы
🤖⚡️Нейронки для генерации видео в стиле Tik Tok

Lumen5 – это инновационный сервис, предназначенный для трансформации текстового контента в видео. С его помощью пользователи могут легко и эффективно создавать увлекательные видеоматериалы из текста, что делает его весьма ценным инструментом для производства контента в социальных сетях.
Wondershare Filmora – это сервис обеспечение для редактирования видео для ПК, позволяющий редактировать и персонализировать видео с применением ИИ.
Adobe Spark - сервис для создания веб-страниц, видео-историй и графики для социальных сетей с применением искусственного интеллекта
Ripl – сервис, генерирующий сценарии для рилсов
Pixaloop – сервис, добавляющий анимацию для фотографий.
Clipomatic - это умный видеоредактор, который превращает все, что говорится голосом, в живые субтитры.
🤖💥Нейронки, которые экономят время
Diffusion Logo — это ИИ-сервис для создания крутых логотипов. Нужно просто описать название компании, вид ее деятельности, какие элементы вы хотели бы видеть в новом товарном знаке и подробно расскажите, что он должен олицетворять — и через несколько секунд у вас будет готовый результат.
Uncrop - нейронка позволяет удалять объекты, фон или текст, настраивать свет, масштабировать и создавать несколько вариантов картинки и многое другое — все это можно делать прямо в браузере
SlidesAI - модель для создания презентаций. Нужно всего лишь дать текст, выбрать тип презентации и указать желаемое количество слайдов.
Meshcapade — нейросервис, который создает цифровые модели для коммерческого применения (рекламы одежды, фитнес-реквизитов и т.д.). Программе достаточно любого фото или 3D-эскиза и через несколько секунд она подготовит полноценный виртуальный аватар в любой выбранной позе.
Summate.it - сервис для извлечения сути любого текста — от объемной статьи до целой книги.
TheGamifAI — нейронка, которая может заменить целую команду гейм разработчиков. В сервисе получится сгенерить не только базовые механики игры, но и подогнать под них сеттинг и персонажей.
🤖💥Подборка AI-инструментов для разработчиков
Cody — это интеллектуальный помощник на основе искусственного интеллекта, такой как ChatGPT, но с дополнительным преимуществом, заключающимся в возможности обучать его работе с бизнесом, командой, процессами и клиентами с помощью собственной базы знаний.
CodeWhisperer — это ИИ-инструмент, который помогает писать код на основе текстовых запросов в IDE. По словам старшего разработчика Amazon Стива Робертса, CodeWhisperer является единственным инструментом-помощником в написании кода, умеющим сканировать код на наличие уязвимостей безопасности. Он сканирует код и на возможные уязвимости, которые сложно обнаружить.
Lintrule — это LLM (большая языковая модель), которая проводит код-ревью. Работает она через командную строку. Для работы Lintrule может подгрузить пользовательские config-файлы и учитывать их при ревью.
OpenCommit — инструмент для создания коммитов, победивший на хакатоне GitHub в этом году. Он видит все изменения в коде и выдает краткое отформатированное описание того, что было сделано. Таким образом, перед коммитом не нужно сводить всем изменения с начала — получается неплохая экономия времени.
Tabnine - может помочь с рефакторингом и линтингом, автоматически создать документацию, а также дописать код. Распространяется бесплатно в виде плагина для популярных IDE.
Snyk Code - средство для проведения статических тестов безопасности приложений. И поскольку это происходит в реальном времени, пропадает необходимость анализировать отчеты.
🤖🙈Теперь любые картинки способны оживать
ChatAnything - модель, которая способна придать жизнь разнообразным объектам, будь то животное, фрукт, монстр или даже ваше собственное фото, создавая говорящего персонажа. При помощи нейронных сетей и алгоритмов текст в речь, программа автоматически выбирает наиболее подходящий тон и настроение для созданного персонажа.
Данная модель позволяет создать любого аватара, из текстового описания или загрузив свое собственное изображение. После этого можно общаться с ним, используя текстовые сообщения голос.
🤖📝Обучение с подкреплением: наиболее распространенные варианты применения
1. Самоуправляемые автомобили - среди задач автономного вождения, в которых может быть применено обучение с подкреплением, можно выделить оптимизацию траектории, планирование движения, динамическое построение маршрута, оптимизацию управления и обучение стратегиям поведения в разных ситуациях на дороге. Например, Компания Wayve.ai успешно применила обучение с подкреплением для обучения автомобиля вождению всего за один день. Для решения задачи удержания полосы движения они использовали алгоритм глубокого обучения с подкреплением. Архитектура сети представляет собой глубокую сеть с 4 сверточными слоями и 3 полностью связанными слоями.
2. Финансы и трейдинг - модели временных рядов, построенные с помощью обучения с учителем, могут использоваться как для прогнозирования будущих продаж, так и для прогнозирования цен на акции. Однако эти модели не определяют, какие действия следует предпринять при той или иной цене акций. На помощь приходит обучение с подкреплением. Агент обучения с подкреплением способен решать такую задачу — принимать решение держать, покупать или продавать акции. Для того чтобы убедиться в оптимальности работы такой модели, она оценивается в сравнении с рыночными эталонами.
3. NLP - В NLP обучение с подкреплением может использоваться для резюмирования текстов, ответов на вопросы, машинного перевода и т.д. Например, исследователи из Стэнфордского университета, Университета штата Огайо и Microsoft Research представили систему глубокого обучения с подкреплением, которая будет использоваться для генерации диалогов. Глубокое обучение с подкреплением может быть использована для моделирования будущих вознаграждений в диалоге с чат-ботом. Диалоги моделируются с помощью двух виртуальных агентов. С помощью градиентных методов можно вознаграждать последовательности, содержащие такие важные атрибуты разговора, как связность, информативность и простота ответа.
4. Здравоохранение - системы, основанные на обучении с подкреплением, нашли свое применение в здравоохранении в назначении лечения пациентам на основе ранее обученных политик. Обучение с подкреплением способно находить оптимальные политики, используя предыдущий опыт, не требуя информации о математической модели биологических систем. Среди подходов с применением обучения с подкреплением в здравоохранении можно выделить динамические схемы лечения (dynamic treatment regimes – DTR) при хронических заболеваниях или критических состояниях, автоматизированную медицинскую диагностику и целый ряд других широких областей.
5. Машиностроение - компания Facebook разработала платформу для обучения с подкреплением с открытым исходным кодом — Horizon. Платформа использует обучение с подкреплением для оптимизации крупномасштабных производственных систем.
🤖💥Библиотека сервисов ИИ-инструментов для буквально любых задач
Aitoptools - библиотека из более 10 000 нейросетей. Удобный сервис, нейросети поделены по категориям. Благодаря строке поиска, можно найти нужный инструмент под свои задачи, просто написав с чем должна помочь нейросеть.
В данную библиотеку входят такие ИИ-аспекты, как: генерация текстов, изображений, видео, кода, таблиц, а также помощники на основе искусственного интеллекта для максимальной продуктивности.
🤖📝⚡️💥StyleTTS 2: На пути к преобразованию текста в речь на человеческом уровне
StyleTTS 2 - модель ля преобразования текста в речь (TTS), которая использует диффузию стилей и состязательное обучение с большими моделями языка речи (SLM) для достижения синтеза речь на человеческом уровне.
StyleTTS 2 отличается от своих предшественников тем, что моделирует стили как скрытую случайную переменную с помощью диффузионных моделей для генерации наиболее подходящего стиля для текста, без эталонных примеров.
Как отмечают разработчики, в данной модели впервые достигнут синтез TTS на человеческом уровне как на одноязычных, так и на многоязычных наборах данных.
😎🤖⚡️Обнаружена альтернатива платному Midjourney
Visual Electric - это стартап, на базе ИИ для творческих профессионалов.
Visual Electric обеспечивает беспроблемный и интуитивно понятный интерфейс, позволяющий даже пользователям без специальных навыков в графическом дизайне создавать профессионально выглядящие изображения.
Данный стартап также решает проблему авторских прав – все изображения, созданные с помощью AI, являются уникальными и не требуют дополнительных расходов на лицензии. Это открывает неограниченные возможности для креатива и экспериментов, ведь теперь пользователи могут создавать визуальные материалы, полностью отвечающие их потребностям и желаниям без каких-либо юридических ограничений.
Стоит также отметить, что данный сервис может стать неплохой альтернативой платного сервиса Midjourney. На данный момент стартап находится на этапе развития. В день доступно 40 бесплатных генераций. Также существует возможность управлять стилями, размерами и параметрами с помощью классического промтинга.
🤖⚡️😎AI-рефакторинг и отладка кода
Metabob представляет собой инновационный инструмент искусственного интеллекта, предназначенный для улучшения кода путем его рефакторинга и отладки. Его функциональность опирается на собственные нейронные сети графов для выявления потенциальных проблем и широкомасштабные языковые модели (LLM) для их пояснения и эффективного устранения. Metabob способен обнаруживать множество логических недочетов, предоставляя возможности для статического анализа кода ИИ, сканирования безопасности программного обеспечения, автоматического исправления ошибок и рефакторинга, а также для оценки метрик проекта.
По словам некоторых разработчиков, они доверяют этому инструменту и воспринимают его как надежный помощник благодаря функциям, таким как минимизация ложных срабатываний, интеграция с проверкой безопасности, сканирование секретов и многие другие. Возможность развертывания Metabob в пределах предприятия на собственном облачном сервере позволяет эффективно обнаруживать и решать проблемы, наиболее значимые для конкретной команды.
🤖AI-Технология для эффекта съемки с дрона
Flythroughs - это приложение, которое позволяет пользователям легко, экономично и доступно создавать кинематографические 3D-изображения. Он использует передовые технологии NeRF и 3D-генеративный искусственный интеллект. Данное приложение создает иллюзию полета камеры и позволяет обозревать объект с любой стороны.
Все, что необходимо пользователю - сделать видеозапись своего дома, кафе, выставки и даже двора, а данная технология с помощью 3D-генерации и NeRF сделает все остальное.
🤖🔥⚡️Немного малоизвестных, но достаточно полезных DL-библиотек на Python
Sketch - использует алгоритмы машинного обучения для понимания контекста пользовательских данных и предоставляет соответствующие предложения по коду. Также Sketch может автоматизировать повторяющиеся задачи, находить ошибки и предлагать исправления, анализировать кодовую базу и предлагать предложения по оптимизации.
MLxtend - включает такие модули как классификатор, кластеризатор, методы оценки, извлечение признаков,предварительная обработка, методы визуализации и т.д. Данный инструмент можно использовать как основной инструмент для задач машинного обучения или в качестве дополнения и вспомогательного инструмента к другим более известным DL-библиотекам
Rembg - библиотека, которая легко поможет удалить фон с изображений. Она использует модели глубокого обучения, предварительно обученные на больших наборах данных.
🤖💡Корректировка графики с помощью ИИ
LEDITS — это AI-сервис для корректировки графики с помощью DDPM и семантического руководства. Сервис умеет добавлять и менять отдельные предметы на картинках с помощью текстовых подсказок.
Достаточно просто загрузить изображение или фото, которое нужно исправить, указываем текстовую команду, что надо удалить/добавить или на чье лицо поменять и получаем быстрый результат
🤖💥⚡️📝Улучшение аудио теперь по щелчку пальцев
Auphonic - это инструмент на основе искусственного интеллекта, который помогает улучшить качество аудиоконтента. Программа использует ИИ для автоматической регулировки уровня громкости, уменьшения фонового шума и улучшения общего качества звучания аудиозаписей. Auphonic также предлагает ряд инструментов для редактирования, позволяющих точно настроить аудиоконтент перед его экспортом. Среди инструментов нейросети также имеется многоуровневая обработка треков, кодировка, настройка громкости и многое другое.
🤖📝⚡️Подборка ИИ-инструментов для работы с видео
Sonix - это программное обеспечение для транскрипции, перевода и подведения итогов с использованием искусственного интеллекта.
Adobe Premiere Pro - это программа для редактирования видео, в которой используются функции, основанные на искусственном интеллекте, для повышения качества видеоматериалов. Программа использует искусственный интеллект для автоматизации процесса редактирования. В число функций, использующих ИИ, входят шаблоны графики движения, автоматическое редактирование и цветокоррекция.
Lumen5 - это инструмент для создания видео на основе искусственного интеллекта, который позволяет создавать высококачественные видеоролики из записей блога или другого письменного контента. Программа использует ИИ для анализа вашего контента и автоматически генерирует сценарий видео, который вы можете редактировать и настраивать.
IBM Watson - это набор инструментов на базе искусственного интеллекта, разработанный компанией IBM для различных приложений, включая обработку аудио и видео. Watson предлагает такие функции, как транскрипция речи в текст, обработка естественного языка и анализ настроений. Он также может использоваться для обработки видео, включая анализ видеоконтента на предмет распознавания объектов, обнаружения сцен и распознавания эмоций.
🤖😎Подборка ИИ-поисковиков
Metaphor - это поисковая система, которая предоставляет возможность осуществлять поиск в интернете с учетом контекста, что делает ее аналогом поиска в Google, но с дополнительной способностью учитывать более широкий контекст запроса.
googpt - это искусственный интеллект, предоставляющий функциональность поиска с краткими резюме. Эта платформа представляет собой интеллектуальный поисковик, который предоставляет краткие и сжатые обзоры информации, сделанные с использованием технологий искусственного интеллекта.
You - это инструмент оптимизации поиска, который может быть установлен поверх Google. Этот сервис предоставляет дополнительные функции и возможности для улучшения процесса поиска, дополняя стандартные возможности Google более продвинутыми инструментами и функционалом.
Perplexity - это инструмент, способный осуществлять поиск по огромной базе данных. Эта платформа обеспечивает эффективный поиск и анализ данных в масштабах, позволяя пользователям получать информацию из обширных наборов данных.
🤖😎Подборка AI-сервисов для создания сайтов
Sidekick – быстрая генерация привлекательных лендингов. Одним из ключевых преимуществ Sidekick является его функция генерации контента. Вы можете сгенерировать различное содержание, такое как электронные письма, игровые сценарии, шаблоны, статьи и посты. Это удобный инструмент для создания качественного контента с помощью искусственного интеллекта.
Jimdo – конструктор сайтов на основе нейронок, работает по промту. Данная система по разработке сайтов предназначенна для предпринимателей, которые занимаются малым и средним бизнесом. Конструктор можно использовать для создания многих видов сайтов, таких как интернет-магазины и другие коммерческие проекты
Durable - генератор веб -сайтов, основанный на искусственном интеллекте, который позволяет пользователям создавать полностью спроектированный веб -сайт с копией, изображениями и контактной формой менее чем за минуту. Он также включает в себя копирайтинг, SEO, аналитику и простой CRM, все с одним входом в систему. Кроме того, он предлагает библиотеку профессиональных изображений и значков и сгенерированных AI идей для названия бизнеса.
Uizard – создает макеты UI/UX, упростит проектирование в разы. Данный сервис позволяет автоматизировать процессы, повысить эффективность совместной работы и создавать интерактивные прототипы. Также есть возможность создавать темы и использовать готовые компоненты для быстрого обновления
🤖💡😎LLM теперь будут гораздо производительнее
Cостоялся новый большой релиз от команды Colossal-AI! Они выложили в открытый доступ новый алгоритм SwiftInfer. Алгоритм позволяет на 46% улучшить производительность LLM!
Данный проект объединяет инновации из двух недавних проектов, таких как StreamingLLM и TensoRT-LLM, чтобы обеспечить лучшую производильность и низкую задержку при выводе LLM.
📌 StreamingLLM решает проблему 'attentional sink' (поглощения внимания) , когда начальные лексемы в тексте получают непропорционально большое внимание алгоритма. В традиционных методах, производительность модели значительно снижается, как только эти начальные лексемы исключаются из окна внимания.
📌 TensorRT-LLM предоставляет пользователям простой в использовании API Python для определения больших языковых моделей (LLM) и создания механизмов TensorRT, которые содержат самые современные оптимизации для эффективного выполнения вывода на графических процессорах NVIDIA.
🤖💡Нейросеть проводит психотерапию
Появился сервис, заточенный на помощь в сложных рабочих ситуациях, таких как отношения в коллективе, успеваемость и пр.
Звучит невероятно, но теперь существует нейросеть Practica AI, которая выступает в роли вашего персонального психолога в виртуальном пространстве. Как отмечают разработчики, этот продукт был создан совместными усилиями экспертов в области психологии, чтобы обеспечить поддержку в самых различных жизненных обстоятельствах – от профессиональных трудностей до личных конфликтов.
Использование Practica предельно просто: расскажите о своей проблеме, и нейросеть предложит вам возможные решения