AI Для Всех
12.1K subscribers
1.01K photos
120 videos
10 files
1.29K links
Канал, в котором мы говорим про искусственный интеллект простыми словами

Главный редактор: @crimeacs

Авторы канала: @GingerSpacetail, @innovationitsme
Download Telegram
NitroFE (Nitro Feature Engineering)

NitroFE - это конструктор функций на языке Python, который предоставляет множество модулей, предназначенных для внутреннего сохранения прошлых зависимых значений для обеспечения непрерывных расчетов.

Умеет работать с:

Time based features
🏔 Indicator based features
💘 Moving average based features

🖥 Код

#features
Forwarded from Denis Sexy IT 🤖
Новое ПО под названием «enerscape» сможет предсказать передвижения крупных животных, минимизируя их контакты с людьми. Вряд ли бы вы хотели, чтобы ваш маршрут пересекался с медвежьими и волчьими тропами.

Традиционно, все карты передвижений основаны на долгосрочных исследованиях данных, которые поступают с животных с датчиками, а составление таких карт отнимает много времени и слишком дорогое. А если радиосвязь в районе отсутствует, то маячок вообще бесполезен.

Enerscape поможет сделать такие карты легко и не дорого, да и и каких-то вводных данных она требует по минимуму. Вся суть в методологии — энергия, котороя животное затрачивает на свой маршрут, рассчитывается на основе его веса и общего поведения при передвижении. Затем эти затраты энергии интегрируются в топографическую информацию о местности и создаются так называемые «энергетические ландшафтные карты» как для отдельных особей, так и для разных групп животных.

ПО было протестировано в Италии в региональном парке Сиренте Велино, где обитает находящийся под угрозой исчезновения бурый медведь. Используя enerscape исследователи обнаружили, что медведи выбирают пути, требующие меньше энергетических затрат (умные медведи 🐻). А эти пути часто пересекаются с населенными пунктами, где столкновения с людьми заканчиваются фатально. Программа определила конфликтные и защитные зоны и проверила, достаточно ли хорошо связаны между собой элементы ландшафта, чтобы медведи могли беспрепятственно по нему перемещаться.

Благодаря тому, что enerscape написана на зыке «R», она может обрабатывать информацию из различных типов экосистем, поэтому учёные надеятся, что таких карт будет в разы больше – с ними легко работать.

На картинке пример создания такой карты, где в исходных данных, основанных на топографии, показывается какое количество калорий необходимо потратить, чтобы пройти по определенному участку местности (нижняя картинка).

Ну, взвешивать по фото, как мы знаем, уже решенная задача, так что алгоритм внезапно клевый.
DeepMind регистрирует компанию по разработке лекарств

CEO DeepMind объявил о создании новой компании Alphabet - Isomorphic Labs - коммерческого предприятия с целью переосмыслить весь процесс открытия лекарств с нуля, используя подход, основанный на искусственном интеллекте, и, в конечном итоге, смоделировать и понять некоторые фундаментальные механизмы жизни.

«Сейчас мы переживаем захватывающий момент истории, когда эти техники и методы [машинное обучение] становятся достаточно мощными и сложными, чтобы их можно было применять для решения реальных проблем, включая научные открытия. Одно из самых важных применений ИИ, которое я могу себе представить, - это область биологических и медицинских исследований, и я страстно желал заняться этой областью в течение многих лет. Сейчас настало время продвигать эту область в темпе и с целевым вниманием и ресурсами, которые предоставит Isomorphic Labs.»

🕵🏻‍♂️
Интервью
TorchDrug

Разработка лекарств - это долгий и дорогостоящий процесс, в среднем на него уходит 10 лет и 2,5 миллиарда долларов. Машинное обучение можно использовать для сокращения времени и стоимости разработки лекарств, делая прогнозы о биомедицинских таргетах на основе больших данных. Платформу машинного обучения TorchDrug была создана для именно такой разработке.

В целом мы уже писали про TorchDrug раньше, но появился повод. Во-первых библиотека значительно обновилась, а во-вторых вышел лонг-рид.

🖥 Код
🔭 Блог-пост

#ScientificML #medicine
Forwarded from Sberloga (Alexander C)
🚀 @SBERLOGA онлайн доклад по биоинформатике и анонс предложений о возможном сотрудничестве :
👨‍🔬 Ирина Починок, Jastyn Anne Pöpplau (University Medical Center Hamburg-Eppendorf) "Combining transcriptomics and electrophysiological recordings of L2/3 pyramidal neurons in the GE-Mouse-Model of schizophrenia."
⌚️ Понедельник 8 ноября, 18.00 по Москве

В наших предыдущих исследованиях мы показали что пирамидальные нейроны в слоях II/III префронтальной коры играют ключевую роль в формировании дисфункций в мышиной модели психических расстройств. В этом проекте мы зарегистрировали электрофизиологическую активность в слоях II/III префронтальной коры этой модели в неонатальном возрасте при одновременной оптогенетической стимуляции пирамидальных нейронов II/III слоя. После записи активности ткань головного мозга мышей препарировалась и ядра пирамидальных нейронов слоя II/III, экспрессирующие флуоресценцию, были отсортированы с помощью FACS с последующей очисткой РНК и секвенированием (20 mio reads, single end, unstrandet, 80 bp, illumina next gen).
Мы хотим идентифицировать (семейство) генов, которые коррелируют с электрофизиологическими особенностями популяции экспрессирующих флуоресценцию нейронов. Кроме того, мы хотим определить, изменяются ли профили экспрессии (семейства) генов (тех, которые коррелируют с электрофизиологическими особенностями) в мышиной модели психических расстройств.

Возможное сотрудничество:

Мы ищем человека для анализа результатов РНК секвенирования. Предлагаем сотрудничество/участие в публикации или можем оформить как фриланс/контракт.

Аффилиация:

University Medical Center Hamburg-Eppendorf, Center for Molecular Neurobiology, Institute of Developmental Neurophysiology (http://www.opatzlab.com/, https://twitter.com/HanganuOpatzLab).
Мы в Гамбурге, Германия.

Контакты:

Irina Pochinok (irina.pochinok@zmnh.uni-hamburg.de),
Jastyn Anne Pöpplau (jastyn.poepplau@zmnh.uni-hamburg.de)

Ссылка на зум будет доступна через тг чат https://t.me/sberlogabio ближе к началу
This media is not supported in your browser
VIEW IN TELEGRAM
EditGAN: High-Precision Semantic Image Editing

NVidia продолжает наступать на пятки компании Adobe, предложив EditGAN. Этот метод, позволяет пользователям редактировать изображения.

EditGAN может манипулировать изображениями с беспрецедентным уровнем детализации и свободы, сохраняя при этом полное качество изображения.

EditGAN - это первая система редактирования изображений на основе GAN, которая одновременно (i) обеспечивает очень высокую точность редактирования, (ii) требует очень мало аннотированных обучающих данных (и не полагается на внешние классификаторы), (iii) может работать интерактивно в реальном времени, (iv) обеспечивает простую композицию нескольких правок, (v) и работает на реальных встроенных, сгенерированных GAN и даже внедоменных изображениях.

код обещают soon

🖥 Проект
📎 Статья

#GAN #editing #images
SustainBench

SustainBench - это коллекция из 15 эталонных задач по 7 целям устойчивого развития (SDG), включая задачи, касающиеся экономического развития, сельского хозяйства, здравоохранения, образования, водоснабжения и санитарии, действий по защите климата и жизни на земле. Целями SustainBench являются:

🚷 снизить входные барьеры для сообщества машинного обучения, чтобы внести свой вклад в измерение и достижение SGD;
📈 предоставить стандартные эталоны для оценки моделей машинного обучения на задачах по целому ряду SDG

📎 Статья
🗂 Датасет

#datasets #ScientificML
This media is not supported in your browser
VIEW IN TELEGRAM
ProsePainter

Создавайте образы, рисуя словами.
ProsePainter сочетает в себе рисование руками с оптимизацией изображения в реальном времени с помощью машинного обучения. Просто скажите, что вы хотите, и выделите нужную область.

🖥 Код

#CLIP #images #multimodal
FS-Mol

Microsoft выпустил датасет молекул для обучения в режиме few-shot (это когда обученной модели показывают несколько примеров чего от неё хотят и просят предсказать на новом).

Данные представляют из себя молекулярные соединения с измерениями активности против различных белковых мишеней.

К данным предлагаются ещё и обученные модельки, что бы было с чем сравнивать.

🗂 Датасет

#ScientificML #datasets
Masked Autoencoders Are Scalable Vision Learners

Ещё одна идея, которая казалось бы была на поверхности, and yet… Берём картиночный автоэнкодер, делим картинку на патчи, прячем их в случайном порядке, и просим декодер восстановить изображение (в режиме self-supervised).

Авторы (Facebook/Meta AI), обнаружили, что скрытие большой части входного изображения, например, 75%, дает нетривиальную и осмысленную задачу для self-supervised обучения. Оказалось, что в такой формулировке, автоэнкодер обучается в ~3 раза быстрее (чем если бы мы учили на изображениях без масок).

Более того, оказалось, что если к такому обученному автоэнкодеру прикрутить голову на классификацию (например), то она будет показывать SOTA результаты. Так же, авторы показывают, что при масштабировании датасета, результаты только улучшаются.

📎 Статья
🖥 Код (не официальный)

#SSL #autoencoders #images
Awesome ML-ops. Нашёл репо со ссылками на (примерно) все инструменты существующие в этой области.
Мозг обладает удивительной способностью обрабатывать визуальную информацию. Люди могут бросить один взгляд на сложную сцену и сразу же быть в состоянии описать увиденное простым языком.

В основе этой способности лежат сложные вычисления, выполняемые зрительной корой. Для того чтобы полностью понять, что это за вычисления, необходимо выяснить, как семантически значимая информация представлена в активациях нейронов зрения.

Исследователи из DeepMind разработали нейросеть β-VAE. Она относится к новому типу интерпретируемых сетей - disentanglement networks. β-VAE учится, предсказывая свои собственные входы; для успешного обучения ей требуется визуальный опыт, аналогичный тому, с которым сталкиваются младенцы; а ее усвоенное скрытое представление похоже на свойства присущие зрительному мозгу.

В своей работе, авторы заметили, что нейроны, обнаруженные с помощью β-VAE, ведут себя как аналогичное по размеру подмножество настоящих нейронов в мозге приматов.

🔭 Блог-пост

#ScientificML
Раскапываю материалы по применению алгоритмов классификации (ML/DL) в различных научных областях (желательно что-то кроме медицины и биологии). Поделитесь хорошими опубликованными статьями?
Benchmarking deep generative models for diverse antibody sequence design

Дизайн новых и разнообразных белков, соответствующих заданной структуре, остается важной нерешенной задачей. В последнее время глубокие генеративные модели, которые обучаются только на основе последовательностей или на основе последовательностей и структур совместно, показали впечатляющие результаты в решении этой задачи.

Исследователи из IBM рассматривают три недавно предложенные глубокие генеративные схемы для проектирования белков: (AR) авторегрессионная генеративная модель на основе последовательности, (GVP) графовая нейронная сеть на основе точной структуры и Fold2Seq.

Авторы сравнили эти модели на задаче вычислительного дизайна последовательностей антител, которая требует проектирования последовательностей с высоким разнообразием для функциональной привязки. Модель Fold2Seq превосходит две другие базовые модели по разнообразию конструируемых последовательностей.

📎 Статья

#ScientificML #biology #generative
SDSS Galaxies

Набор данных из 306 006 галактик, координаты которых взяты из Sloan Digital Sky Survey Data Release. Изображения галактик получены с помощью спектроскопического прибора Dark Energy Spectroscopic Instrument.

🗂 Данные
📎 Статья

#ScientificML #astronomy #datasets
This media is not supported in your browser
VIEW IN TELEGRAM
MetNet-2. Глубокое обучение для 12 часового прогноза осадков.

Прогнозирование погоды обычно опирается на традиционные методы, основанные на физике и использующие крупнейшие в мире суперкомпьютеры (об этом очень хорошо написано у Вастрика). Такие методы ограничены высокими вычислительными требованиями и чувствительны к приближениям физических законов, на которых они основаны.

Глубокое обучение предлагает новый подход к вычислению прогнозов (как например в недавней работе от DeepMind). Модели глубокого обучения не включают в себя явные физические законы, а учатся предсказывать погодные условия непосредственно на основе наблюдаемых данных и способны вычислять прогнозы быстрее, чем методы, основанные на физике.

В новой работе, Google AI демонстрирует нейросеть для прогнозирования осадков на следующие 12 часов (с пространственным разрешением в 1 км и временным разрешением в 2 минуты).

📎 Статья
🔭 Блог-пост

#ScientificML #earthscience #meteorology
Многие алгоритмы машинного обучения, как supervised, так и self-supervised, используют метрики расстояния. В этой чудесной шпаргалке подробно рассмотрены основные 9.

Знание того, когда использовать ту или иную меру расстояния, может помочь вам пройти путь от плохого классификатора до точной модели.

🔭 Блог-пост

#basics #training
Forwarded from Denis Sexy IT 🤖
Похоже, опенсорсное ПО по изучению структуры белков начинает приносить свои плоды — коллаборация учёных получила данные о том, как трёхмерные структуры белков собираются вместе, образуя многобелковый комплекс. Дальше будет сложно, но мне кажется один фиг интересно.

Вот тут можете освежить в памяти инфу, я писал об нейронке AlphaFold2 от DeepMind, которая достаточно точно предсказывает структур молекулы белка, исходя из определенного набора аминокислот. Новое же исследование как бы немного переступает этот шаг и говорит сразу о том, как эти молекулы объединяются в сложные структуры, что очень круто.

Например, комплекс, создающий копии наших хромосом обычно состоит из более чем десятка белков, объединенные структуры которых требуют тщательной координации их химических изменений. А для того чтобы собрать эти и другие комплексы вместе, необходимо правильно сложить составляющие их белки в нужные трехмерные формы. AlphaFold и RoseTTAFold как раз этим и занимаются, но после того, как складывание завершено, белки должны взаимодействовать друг с другом, правильно соединяться (например «+» заряд на одном белке соответствует «-» заряду на его партнёре).

Метод нейронок оказался полезным при сборке многобелковых структур — RoseTTAFold, например, частично разбивает аминокислотную последовательность белка на более мелкие части и считает каждую из них, прежде чем собрать конструктор. При этом обнаружили, что если подать RoseTTAFold кусочки двух разных белков, она с радостью скушает инфу и соберет оба белка, учитывая их ориентацию и расстояние между ними.

Еще крутой особенностью алгоритмов является то, что их прогнозы опираются на эволюцию — например мутации, когда «+» в белке А мутирует и не может взаимодействовать с «-» в белке Б, алгоритм просчитывает даже варианты, если «-» белка Б тоже будет мутировать и компенсирует проблему, потому что не все аминокислоты могут образовывать спиральные структуры.

Круто осознавать, что вот только в июле появившиеся нейронки уже дают какие-то полезные данные, а ведь прошло меньше чем пол года. И это еще один шаг навстречу лечения разных серьезных заболеваний с помощью таких вот моделей 🧬
TorchGeo - PyTorch‘овая библиотека от Microsoft, аналогичная torchvision. В ней есть наборы данных, преобразования, семплеры и предварительно обученные модели, специфичные для geospatial (ГИС) данных.

🖥 Код
📎 Статья

#earthscience #geo #ScientificML #library
Forwarded from Sberloga (Alexander C)
🚀 @SBERLOGA онлайн семинар по биоинформатике:
👨‍🔬 Всеволод Макеев (ИОГен РАН): «Различные задачи геномики, решающиеся с помощью задачи разладки»
⌚️ Пятница 19 Ноября, 18.00 (Moscow time)

Абстракт будет позднее.

О докладчике:
Всеволод Юрьевич Макеев - член-корреспондент РАН, заведующий отделом ИОГен РАН

Ссылка на зум будет доступна в чате: https://t.me/sberlogabio ближе к началу доклада.