StoryDiffusion - новый инструмент, для создания, последовательных историй: изображений и видео.
Модель позволяет создавать комиксы в различных стилях, с акцентом на последовательное повествование и поддержание единого стиля окружения, персонажей и их одежды.
StoryDiffusion совместим со всеми моделями на базе
SD1.5 и SDXL.
• Github: https://github.com/HVision-NKU/StoryDiffusion
• Paper: https://arxiv.org/abs/2405.01434
• Demo: https://storydiffusion.github.io
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
⚡️ Google just dropped Code Gemma 1.1 7B IT 🔥
СЮРПРИЗ: Google только что выпустила Code Gemma 1.1 7B IT 🔥
Модели постепенно становятся все совершеннее в генерации кода .
Значительный прогресс достигнут для C#, Go, Python 🐍
Вместе с версией 7B они также выпустили обновленную базовую модель 2B.
Наслаждайтесь!
• 7B: https://huggingface.co/google/codegemma-1.1-7b-it
• 2B: https://huggingface.co/google/codegemma-1.1-2b
• Report: https://storage.googleapis.com/deepmind-media/gemma/codegemma_report.pdf
@ai_machinelearning_big_data
СЮРПРИЗ: Google только что выпустила Code Gemma 1.1 7B IT 🔥
Модели постепенно становятся все совершеннее в генерации кода .
Значительный прогресс достигнут для C#, Go, Python 🐍
Вместе с версией 7B они также выпустили обновленную базовую модель 2B.
Наслаждайтесь!
• 7B: https://huggingface.co/google/codegemma-1.1-7b-it
• 2B: https://huggingface.co/google/codegemma-1.1-2b
• Report: https://storage.googleapis.com/deepmind-media/gemma/codegemma_report.pdf
@ai_machinelearning_big_data
⚡️ Finetuning for Text Classification
Если вы ищете чем занаться на выходных и хотите немного почитать и покодить,- вот свежая глава из книги Build an LLM from Scratch, по настройке GPT-модели для классификации СПАМ-сообщений с точностью до 96%.
Модель небольшая и обучение на MacBook Air M3 занимает ~ 5 минут.
▪ Github
#book #tutorial #llm
@ai_machinelearning_big_data
Если вы ищете чем занаться на выходных и хотите немного почитать и покодить,- вот свежая глава из книги Build an LLM from Scratch, по настройке GPT-модели для классификации СПАМ-сообщений с точностью до 96%.
Модель небольшая и обучение на MacBook Air M3 занимает ~ 5 минут.
▪ Github
#book #tutorial #llm
@ai_machinelearning_big_data
StarCoder2-Instruct - это первый полностью самонастраивающийся LLM-разработчик кода с помощью конвейера Hugging Face.
Этот конвейер использует StarCoder2-15B для генерации тысяч пар "промпт-ответ", которые затем используются для точной настройки StarCoder-15B без каких-либо человеческих аннотаций или дистиллированных данных из огромных и проприетарных LLM.
StarCoder2-15B-Instruct набрал 72,6 балла по шкале HumanEval и даже превосходит CodeLlama-70B-Instruct с ее 72,0 балла !
Оценки на LiveCodeBench показывают, что самонастраивающаяся модель работает даже лучше, чем та же модель, обученная на основе данных, полученных из GPT-4, это означает, что LLM может более эффективно учиться на собственных данных.
▪Blog: https://huggingface.co/blog/sc2-instruct
▪Model: https://huggingface.co/bigcode/starcoder2-15b-instruct-v0.1
▪Dataset: https://huggingface.co/datasets/bigcode/self-oss-instruct-sc2-exec-filter-50k
▪Code: https://github.com/bigcode-project/starcoder2-self-align
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
3 дня назаю в Стэнфорде Сэм Альтман поделился своими мыслями об искусственном интеллекте.
Сложно остановиться и перестать пересматривать некоторые моменты.
Вот 6 ключевых мыслей:
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Quivr — это open-source локальная и приватная альтернатива OpenAI GPTs и ChatGPT.
Позволяет извлекать информацию из локальных файлов (PDF, CSV, Excel, Word, аудио, видео...), используя Langchain, GPT 3.5/4 turbo, Private, Anthropic, VertexAI, Ollama, LLMs, Groq.
Даёт возможность легко делится своей базой знаний через публичную ссылку.
Quivr работает в автономном режиме, поэтому вы можете получить доступ к своим данным в любое время и в любом месте.
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Pytup в Нижнем Новгороде 1 июня
Вас ждёт большая конференция по Python-разработке Pytup.
В программе — выступления спикеров, новости языка, актуальные кейсы экспертов и, конечно, нетворкинг.
Узнаете, как создать платформу для обработки данных в вашей IT-компании или микросервис обработки геометрических данных. А ещё послушаете крутые доклады, получите ответы на вопросы и пообщаетесь со спикерами и коллегами.
Зарегистрироваться на Pytup! 💛
Вас ждёт большая конференция по Python-разработке Pytup.
В программе — выступления спикеров, новости языка, актуальные кейсы экспертов и, конечно, нетворкинг.
Узнаете, как создать платформу для обработки данных в вашей IT-компании или микросервис обработки геометрических данных. А ещё послушаете крутые доклады, получите ответы на вопросы и пообщаетесь со спикерами и коллегами.
Зарегистрироваться на Pytup! 💛
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️OpenDevin
OpenDevin — это open-source проект, цель которого - воспроизвести Devin, автономного AI-программиста, способного выполнять сложные инженерные задачи и активно сотрудничать с пользователями в проектах по разработке ПО.
OpenDevin стремится повторить, улучшить и усовершенствовать Devin.
Запуск OpenDevin с помощью Docker:
▪GitHub
▪Страничка OpenDevin
@ai_machinelearning_big_data
OpenDevin — это open-source проект, цель которого - воспроизвести Devin, автономного AI-программиста, способного выполнять сложные инженерные задачи и активно сотрудничать с пользователями в проектах по разработке ПО.
OpenDevin стремится повторить, улучшить и усовершенствовать Devin.
Запуск OpenDevin с помощью Docker:
# The directory you want OpenDevin to modify. MUST be an absolute path!
export WORKSPACE_BASE=$(pwd)/workspace
docker run \
--pull=always \
-e SANDBOX_USER_ID=$(id -u) \
-e WORKSPACE_MOUNT_PATH=$WORKSPACE_BASE \
-v $WORKSPACE_BASE:/opt/workspace_base \
-v /var/run/docker.sock:/var/run/docker.sock \
-p 3000:3000 \
--add-host host.docker.internal=host-gateway \
ghcr.io/opendevin/opendevin:0.5
▪GitHub
▪Страничка OpenDevin
@ai_machinelearning_big_data
🔥Machine learning Interview Questions
Вопросы и ответы с собеседований.
Большая, подборка вопросов и ответов с собеседований по ML, Data Science,Ai, статистике, теории вероятностей python, SQL.
ML
▪100 вопросов c собесов по машинному обучению 2024
▪Сборник ответов с собесов по машинному обучению от FAANG, Snapchat, LinkedIn.
▪Facebook. Вопросы по машинному обучению 2024 год
▪Google руководство по прохождению собеса в 2024 году
▪ Подготовка к собеседованию по ML: ответы на основные вопросы
▪ 14 типичных вопросов с собеседования по ML
▪ Вопросы для собеседования на позицию ML-инженера
▪ Решения вступительных испытаний в ШАД
▪ Решения вступительных испытаний в ШАД архив
▪AI Interviews at Apple, OpenAI, Bloomberg & JP Morgan – What to Expect
▪Apple Machine Learning Engineer (MLE) Interview Guide
▪Junior ML-инженер | Выпуск 1 | Собеседование
▪Успешное собеседование в Яндекс
▪Как я проходил собеседования на Machine Learning Engineer
NLP
▪100 вопросов и ответов для интервью по NLP
▪Топ-50 вопросов собеседований NLP
▪ Вопросы по NLP 2024 года
▪ Еще 100 NLP вопросов
DS
▪Материалы для подготовки к интервью data science
▪ Вопросы/ответы DS
▪100 вопросов для подготовки к собесу Data Science
▪Временные ряды. Топ 50 вопросов
Python
▪100 вопросов для подготовки к собесу Python
▪ 50 вопросов по PyTorch
▪45 Вопросов с собеседований Pandas
▪400 самых популярных вопросов-ответов для Python-разработчика.
▪100 вопросов видео
▪LeetCode Pandas
AI
▪30 вопросов промпт инжинирингу
▪ 15 вопросов по LLM и AI
▪27 Вопросов по Chatgpt
Math
▪ Вопросы с собеседований по статистике
▪ Вопросы по теории вероятности
▪ LeetCode: разные решения с кодом
▪Top 75 Statistics Interview Questions
▪40 вопросов по статистике с собеседований на должность Data Scientist
▪Statistics Interview Questions & Answers for Data Scientists
SQL
▪Задачи с собеседований SQL
Подборка будет постепенно обновляться, делитесь в комментариях полезными ресурсами, которые стоит сюда добавить.
#interview #вопросыссобесов #ml #ds
@ai_machinelearning_big_data
Вопросы и ответы с собеседований.
Большая, подборка вопросов и ответов с собеседований по ML, Data Science,Ai, статистике, теории вероятностей python, SQL.
ML
▪100 вопросов c собесов по машинному обучению 2024
▪Сборник ответов с собесов по машинному обучению от FAANG, Snapchat, LinkedIn.
▪Facebook. Вопросы по машинному обучению 2024 год
▪Google руководство по прохождению собеса в 2024 году
▪ Подготовка к собеседованию по ML: ответы на основные вопросы
▪ 14 типичных вопросов с собеседования по ML
▪ Вопросы для собеседования на позицию ML-инженера
▪ Решения вступительных испытаний в ШАД
▪ Решения вступительных испытаний в ШАД архив
▪AI Interviews at Apple, OpenAI, Bloomberg & JP Morgan – What to Expect
▪Apple Machine Learning Engineer (MLE) Interview Guide
▪Junior ML-инженер | Выпуск 1 | Собеседование
▪Успешное собеседование в Яндекс
▪Как я проходил собеседования на Machine Learning Engineer
NLP
▪100 вопросов и ответов для интервью по NLP
▪Топ-50 вопросов собеседований NLP
▪ Вопросы по NLP 2024 года
▪ Еще 100 NLP вопросов
DS
▪Материалы для подготовки к интервью data science
▪ Вопросы/ответы DS
▪100 вопросов для подготовки к собесу Data Science
▪Временные ряды. Топ 50 вопросов
Python
▪100 вопросов для подготовки к собесу Python
▪ 50 вопросов по PyTorch
▪45 Вопросов с собеседований Pandas
▪400 самых популярных вопросов-ответов для Python-разработчика.
▪100 вопросов видео
▪LeetCode Pandas
AI
▪30 вопросов промпт инжинирингу
▪ 15 вопросов по LLM и AI
▪27 Вопросов по Chatgpt
Math
▪ Вопросы с собеседований по статистике
▪ Вопросы по теории вероятности
▪ LeetCode: разные решения с кодом
▪Top 75 Statistics Interview Questions
▪40 вопросов по статистике с собеседований на должность Data Scientist
▪Statistics Interview Questions & Answers for Data Scientists
SQL
▪Задачи с собеседований SQL
Подборка будет постепенно обновляться, делитесь в комментариях полезными ресурсами, которые стоит сюда добавить.
#interview #вопросыссобесов #ml #ds
@ai_machinelearning_big_data
TrustLLM
— инструмент на Python
для комплексного исследования ответов от LLM. TrustLLM рассматривает 6 аспектов ответов: правдивость, безопасность, этичность, соблюдение конфиденциальности и другие.
В этом документе подробно объясняется, как использовать инструмент для оценки эффективности собственных моделей.
pip install trustllm
▪GitHub
▪Arxiv
▪Docs
▪Project
#llm
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
💥 New tools to help researchers study content authenticity by OpenAi
OpenAi запускает для тестов новый классификатор, который поможет идентифицировать контент, созданный DALLE 3.
В этом году они уже начали добавлять метаданные CPAN ко всем изображениям, созданным и отредактированным DALE 3, в ChatGPT и OpenAI API.
Они также планируют интегрировать метаданные C2PA для Sora, когда модель будет выпущена.
▪ Почитать подробнее можно здесь
#openai #dalle3
@ai_machinelearning_big_data
OpenAi запускает для тестов новый классификатор, который поможет идентифицировать контент, созданный DALLE 3.
В этом году они уже начали добавлять метаданные CPAN ко всем изображениям, созданным и отредактированным DALE 3, в ChatGPT и OpenAI API.
Они также планируют интегрировать метаданные C2PA для Sora, когда модель будет выпущена.
▪ Почитать подробнее можно здесь
#openai #dalle3
@ai_machinelearning_big_data
Эффективный метод быстрого освоения ChatGPT.
Обучение нейронной сети и создание правильных промптов – это длительный процесс, который требует значительного времени.
Здесь разработан краткий курс из 5 уроков по ChatGPT. После его завершения вы сможете создать 9 нейронных сетей, которые помогут вам:
- находить ошибки и оптимизировать код
- генерировать посты в Телеграме
- создавать заголовки для рекламы
- делегировать рутинные задачи нейронке
Вы также сможете разработать своих собственных нейро-помощников для продаж, маркетинга и других целей.
Бесплатный доступ предоставляется сразу после регистрации.
Реклама. ООО "ТЕРРА ЭЙАЙ". ИНН 9728019395. erid: LjN8K921a
Обучение нейронной сети и создание правильных промптов – это длительный процесс, который требует значительного времени.
Здесь разработан краткий курс из 5 уроков по ChatGPT. После его завершения вы сможете создать 9 нейронных сетей, которые помогут вам:
- находить ошибки и оптимизировать код
- генерировать посты в Телеграме
- создавать заголовки для рекламы
- делегировать рутинные задачи нейронке
Вы также сможете разработать своих собственных нейро-помощников для продаж, маркетинга и других целей.
Бесплатный доступ предоставляется сразу после регистрации.
Реклама. ООО "ТЕРРА ЭЙАЙ". ИНН 9728019395. erid: LjN8K921a
➡ Новости: теперь вы можете публиковать свои модели прямо из Keras API в Kaggle или huggingface!
Вот руководство по началу работы на любой из платформ → https://developers.googleblog.com/en/publish-your-keras-models-on-kaggle-and-hugging-face/
@ai_machinelearning_big_data
Вот руководство по началу работы на любой из платформ → https://developers.googleblog.com/en/publish-your-keras-models-on-kaggle-and-hugging-face/
@ai_machinelearning_big_data
🌟 Introduction to Granite Code Models
IBM выпустили Granite Code Models: семейство моделей Open Foundation для интеллектуального анализа и генерации кода
Все модели Granite Code выпущены под лицензией Apache 2.0.
Модели Granite превосходят модели с открытым исходным кодом по всем параметрам. На рисунке показано, как Granite-8B-CodeBase превосходит Mistral-7B, LLama-3-8B и другие модели с открытым исходным кодом в трех задачах кодинга. Полные оценки можно найти здесь.
Модели отлично справляются с задачами генерации кода, исправления багов объяснения кода, генерации документации к кода.
- Размер моделей варьируется от 3B до 34B параметров
- Обученных на 3-4 тыс. токенах, полученных из 116 языков программирования
▪Github: https://github.com/ibm-granite/granite-code-models
▪Paper: https://arxiv.org/abs/2405.04324
▪HF: https://huggingface.co/collections/ibm-granite/granite-code-models-6624c5cec322e4c148c8b330
#llm #codegeneration
@ai_machinelearning_big_data
IBM выпустили Granite Code Models: семейство моделей Open Foundation для интеллектуального анализа и генерации кода
Все модели Granite Code выпущены под лицензией Apache 2.0.
Модели Granite превосходят модели с открытым исходным кодом по всем параметрам. На рисунке показано, как Granite-8B-CodeBase превосходит Mistral-7B, LLama-3-8B и другие модели с открытым исходным кодом в трех задачах кодинга. Полные оценки можно найти здесь.
Модели отлично справляются с задачами генерации кода, исправления багов объяснения кода, генерации документации к кода.
- Размер моделей варьируется от 3B до 34B параметров
- Обученных на 3-4 тыс. токенах, полученных из 116 языков программирования
▪Github: https://github.com/ibm-granite/granite-code-models
▪Paper: https://arxiv.org/abs/2405.04324
▪HF: https://huggingface.co/collections/ibm-granite/granite-code-models-6624c5cec322e4c148c8b330
#llm #codegeneration
@ai_machinelearning_big_data