AI Для Всех

Deep Neural Networks and Tabular Data: A Survey

Гетерогенные табличные данные являются наиболее часто используемой формой данных в науке и необходимы для многочисленных критически важных и требовательных к вычислениям приложений. На однородных наборах данных глубокие нейронные сети неоднократно демонстрировали отличную производительность и поэтому получили широкое распространение. Однако их применение для моделирования табличных данных (вывод или генерация) остается весьма проблематичным. В данной работе представлен обзор современных методов глубокого обучения для табличных данных.

Методы разделили на три группы: преобразования данных, специализированные архитектуры и модели регуляризации. По каждой группе предоставлен обзор основных подходов.

Основной вклад работы заключается в рассмотрении основных направлений исследований и существующих методологий в этой области, а также в выделении соответствующих проблем и открытых исследовательских вопросов.

Насколько я понимаю, это первый углубленный взгляд на подходы глубокого обучения для табличных данных. Работа может послужить ценной отправной точкой и руководством для исследователей и практиков, заинтересованных в глубоком обучении с использованием табличных данных.

Статья

#tabular #tables

1.4K views13:15

AI Для Всех

Localizing Objects with Self-Supervised Transformers and no Labels 🏷

Аннотация или labelling данных, довольно нудное и трудоёмкое занятие.

В статье предлагают простой подход к решению этой проблемы. Давайте научимся локализоваться объекты в режиме self-supervised. В качестве нейросети - используют трансформер (ViT, про который я писал тут).

Авторы сравниваются с SOTA обнаружения объектов, превосходят на 8 баллов CorLoc на PASCAL VOC 2012. Более того, показывают многообещающие результаты в задаче обнаружения объектов без наблюдения.

Статья
Код

#SSL #transformer #detection

943 viewsedited 08:40

AI Для Всех

Обновления по графовым сетям, которые сейчас активно исследуются для биологических и химических целей.

(1) На YouTube выложили лекцию профессора Макса Веллинга (Max Welling) по графовым нейронным сетям для симуляции молекул.

(2) умельцы собрали Colab блокнот по обучению графовой нейронной сети для классификации молекул на основе их биологической активности. В блокноте разбираются аспекты использования Jraph (JAX библиотеки для графов).

#ScientificML #gnn #graphs #biology #chemistry

1.1K viewsedited 12:36

AI Для Всех

Попалась статья по материаловедению и ML. Сделано Гуглом - Finding Complex Metal Oxides for Technology Advancement. В связи с чем вопрос, кто-нибудь в канале занимается материаловедением?

#ScientificML #materials

983 views10:16

AI Для Всех

0:18

This media is not supported in your browser

VIEW IN TELEGRAM

Мы (мы это я, автор канала Артемий) тут совместно с MSU.ai и брендом украшений MONOLAMA выпустили коллекцию брошек сгенерированных нейросетью VQGAN+CLIP.

Подробнее о проекте почитать можно тут, а заказать себе брошку тут.

#этополюбви

1.0K viewsedited 13:09

AI Для Всех

High-throughput single-cell quantification of hundreds of proteins using conventional flow cytometry and machine learning

Современные иммунологические исследования все чаще требуют проведения многомерных анализов для понимания сложной среды типов клеток, составляющих микросреду тканей при заболеваниях. Для достижения этой цели авторы разработали Infinity Flow, объединяющий сотни перекрывающихся панелей проточной цитометрии с использованием машинного обучения для одновременного анализа коэкспрессии сотен поверхностно экспрессируемых белков на миллионах отдельных клеток.

В этом исследовании они демонстрируют, что этот подход позволяет провести всесторонний анализ клеточного состава устойчивого состояния мышиного легкого и выявить ранее неизвестную клеточную гетерогенность в легких мышей, несущих метастазы меланомы.

Infinity Flow - это хорошо масштабируемое, недорогое и доступное решение для одноклеточной протеомики в сложных тканях.

Статья в Science

#ScientificML #immunology #medicine

1.1K views11:17

AI Для Всех

Forwarded from Denis Sexy IT 🤖

Наткнулся на прикольную нейронку аля социальный проект у которой на днях опубликовали модельки:
Алгоритм пытается показать зрителю, как выглядело бы фото если бы город затопило в результате глобального потепления (Внутри GAN + карта глубины).

Я попробовал поиграться и прогнал через нейронку 10 городов-миллионников РФ.

Мне кажется как концепт выглядит довольно доходчиво, кстати, подобное приложение я уже видел для AR, но там графика похуже.

🌊 Тут я собрал Colab, можете поиграться | Тут исходный код

P.S. Если будете играться, то лучше побольше фотографий прогнать, чтобы было из чего потом выбирать, я выбрал самые аккуратные

993 views13:04

AI Для Всех

Too long; didn’t read

Вы прочитали картинку? Большинство из вас скорее всего прочитали только нижнюю часть, и то наискосок.

TLDR9+ - масштабный набор данных для обобщения, содержащий более 9 миллионов учебных примеров, извлеченных из дискуссионного форума Reddit. Этот набор данных специально собран для выполнения экстремального обобщения (т.е. генерации резюме из одного предложения с высокой степенью сжатия и абстракции).

Скорее бы появилось что-то в открытом доступе, а то сколько можно статей то в день прочитать :)

Датасет

#datasets #nlp #summarization

1.6K views19:04

AI Для Всех

5 минут назад выложили код StyleGan3 (он же Alias-Free GAN, про который я писал тут) - го тестить кто может!

Код

UPD: собрал Colab StyleGAN3

#gan

2.2K viewsedited 21:21

AI Для Всех

This media is not supported in your browser

VIEW IN TELEGRAM

SubTab: Subsetting Features of Tabular Data for Self-Supervised Representation Learning

AstraZeneca выпустила статью и код по self-supervised learning для табличных (!) данных. Даже не задумывался что так можно было.

Одним из основных компонентов успеха self-supervised learning на изображениях, аудио и тексте является использование пространственной, временной и семантической структуры данных. Однако в табличках, такая структура может отсутствовать, что затрудняет разработку эффективного метода аугментации и препятствует аналогичному прогрессу в работе с табличными данными.

В этой статье авторы представляют новую структуру - Subsetting features of Tabular data (SubTab), которая превращает задачу обучения на основе табличных данных в задачу обучения на основе многовидового представления путем разделения входных характеристик на несколько подмножеств. Эксперименты показали, что SubTab достигает производительности SOTA 98,31% на MNIST в табличной версии.

📎Статья 🖥Код

#tables #SSL #tabular

1.6K viewsedited 07:48

AI Для Всех

Protein complex prediction with AlphaFold-Multimer

В то время как подавляющее большинство хорошо структурированных одиночных белковых цепей теперь могут быть предсказаны с высокой точностью благодаря недавно разработанной модели AlphaFold, предсказание многоцепочечных белковых комплексов во многих случаях остается сложной задачей.

В статье от DeepMind демонстрируют, что модель AlphaFold, специально обученная на мультимерных входах с известной стехиометрией (AlphaFold-Multimer), значительно повышает точность предсказания мультимерных интерфейсов по сравнению с одноцепочечной AlphaFold, сохраняя при этом высокую точность внутри цепи.

📎Статья

#ScientificML #biology

1.5K viewsedited 14:44

About

Blog

Apps

Platform