AI Для Всех

Часть 7. Q&A с Андреем Карпаты

Q: Что вы думаете о Devin и как он сопоставляется с другими инструментами, такими как Workspace от Microsoft?
Андрей поделился своим мнением о Devin, программном инженере искусственного интеллекта, разработанном компанией Cognition, и сравнил его с GitHub Copilot Workspace от Microsoft:

- Участие Карпаты: Андрей упомянул, что он является ангелом-инвестором Devin, что говорит о его вере в потенциал платформы.

- Возможности Devin: Devin - полностью автономный программный инженер ИИ, который может изучать незнакомые технологии, создавать и развертывать приложения, находить и исправлять ошибки в кодовых базах, обучать и настраивать модели ИИ и решать проблемы в репозиториях.

- Метрики на SWE-bench: Девин установил новый рекорд на кодовом бенчмарке SWE-bench, правильно решив 13,86 % реальных проблем GitHub, что значительно превышает предыдущий рекорд в 1,96 %.

- Workspace от Microsoft как конкурент: Microsoft представила GitHub Copilot Workspace - инструмент, который напрямую конкурирует с Devin. Карпаты признал, что Workspace является грозным конкурентом и, скорее всего, победит на рынке.

- Приобретение или уничтожение: Учитывая конкурентную среду, Андрей предположил, что лучшим сценарием для Devin будет приобретение компании более крупным игроком. Однако он также признал возможность того, что Devin может быть раздавлена конкурентами, особенно таким устоявшимся технологическим гигантом, как Microsoft.

Q: Имеет ли смысл обучать большие языковые модели на национальных языках, учитывая нынешнее доминирование английского языка в ИИ?

- Доминирование английского языка в ИИ: В настоящее время ИИ и LLM в основном разрабатываются и обучаются на англоязычных данных. Это связано с огромным количеством англоязычного контента, доступного в Интернете, а также с тем, что многие исследователи и компании, занимающиеся разработкой ИИ, базируются в англоязычных странах.

- Корреляция количества данных и качетсва LLM: Качество LLM напрямую зависит от объема данных, на которых они обучаются. Большее количество данных, как правило, приводит к повышению качества и созданию более способных моделей.

- Распределение языков в Llama 3: В качестве примера Карпаты упомянул, что Llama 3 обучается на наборе данных, состоящем на 90 % из английского и лишь на 10 % из других языков. Он подчеркнул, что это был осознанный выбор разработчиков.

- Качество на английском языке соответствует GPT-4: качество Llama 3 на английском языке соответствует GPT-4, одной из самых передовых LLM на сегодняшний день. Однако высокое качество достигается за счет игнорирования других языков.

- Компромисс в языковом потенциале: Разработка LLM на национальных языках потребует выделения части ресурсов модели для этих языков, что, в свою очередь, приведет к сокращению ресурсов, доступных для английского языка. Такой компромисс потенциально может привести к снижению качетсва на английском языке по сравнению с монолингвальными англоязычными моделями.

- Качество GPT на исландском языке: Несмотря на доминирование английского языка, GPT отлично работает на исландском языке. Это объясняется тем, что исландское правительство специально запросило языковую поддержку, что подчеркивает потенциал LLM для достижения высоких результатов на неанглийских языках, если им уделяется достаточное внимание и выделяются соответствующие ресурсы (а еще это неплохая бизнес модель, плати нам деньги, и твои граждане смогут пожинать плоды прогресса).

- Инвестиции в модели, ориентированные на конкретные языки: Учитывая потенциал высоких результатов на неанглийских языках и отсутствие конкуренции на некоторых языковых рынках, возможно, имеет смысл инвестировать в разработку моделей для конкретных языков. Такой подход может способствовать развитию языкового разнообразия и расширению доступа к технологиям ИИ для людей, не говорящих по-английски.

Часть 1.
Часть 2.
Часть 3.
Часть 4.
Часть 5.
Часть 6.

Часть 8.
Часть 9.
Часть 10.
Часть 11.
Часть 12.
Часть 13.

Продолжение следует

www.cognition.ai

Cognition | Introducing Devin, the first AI software engineer

We are an applied AI lab building end-to-end software agents.

3.8K viewsArtemii, edited 16:25