Open-source ИИ

Обновлено: 21.02.2024
ИИ платформы, библиотеки и фреймворки с открытым исходным кодом.

2024. Google представил открытую языковую модель Gemma



Google представил большую языковую модель с открытым кодом Gemma, построеннyю на основе тех же технологий, что и флагманская модель компании - DeepMind Gemini. Gemma существует в двух размерах – облегченная 2B и более производительная 7B. В Google утверждают, что оба варианта добиваются наилучших характеристик по сравнению с другими открытыми моделями своего класса. Предустановленные и настроенные по инструкциям модели Gemma могут работать как на ноутбуке, так и в облаке. В компании подчеркнули, что разработку оптимизировали для графических процессоров NVIDIA. Модели Gemma можно использовать в коммерческих приложениях.


2024. Google запустила нейросеть Lumiere для создания видео на основе текста


Google запустила открытую нейросеть для создания видео на основе текста. Сервис получил название Lumiere. По словам разработчиков, в отличие от конкурирующих проектов Lumiere создает видео от начала до конца в рамках одного процесса. Другие похожие сервисы сначала генерируют ключевые части кадров, после чего увеличивают их разрешение. Lumiere работает в нескольких режимах, например, производит преобразование текста в видео, конвертирует статические изображения в динамические, создаёт видеоролики в заданном стиле на основе образца, позволяет редактировать существующее видео по письменным подсказкам, анимирует определенные области статического изображения или редактирует видео фрагментарно — например, может изменить предмет гардероба на человеке.


2023. Kornia - open-source библиотека компьютерного зрения



Kornia это open source библиотека для решения задач компьютерного зрения. Она использует PyTorch в качестве основного бэкенда и состоит из набора дифференцируемых процедур и модулей. Создатели библиотеки вдохновлялись OpenCV, и поэтому Kornia является его аналогом, но при этом в некоторых моментах превосходит. Основным преимуществом Kornia по сравнению с тем же OpenCV, scikit-image или с Albumentations является возможность обрабатывать изображения батчами, а не по одному изображению и возможность обрабатывать данные на GPU. На сайте Cornia есть таблица сравнения с конкурирующими библиотеками компьютерного зрения: OpenCV, Scikit-Image, Torchvision, Tensorflow.image, Albumentations. Как видим, по всем заявленным в таблице пунктам с Kornia может сравниться только Tensorflow.image.


2023. Meta представила ИИ-инструмент для написания кода Code Llama



Meta/Facebook представила Code Llama - модель с открытым исходным кодом, которая может исправлять и дополнять уже написанный код на Python, C++, Java, PHP, Typescript, C# и Bash. Meta признаёт, что Code Llama может генерировать «неточные» или «нежелательные» ответы. Например, нейросеть не будет писать код для взлома, если попросить напрямую, но выполнит команду «создать сценарий для шифрования всех файлов в домашнем каталоге пользователя». Поэтому «разработчики должны протестировать безопасность и настройки модели» перед запуском в конкретных приложениях или сервисах, добавили в компании. Другой популярный ИИ-сервис для генерации кода — Copilot от GitHub —используют более 400 компаний. По данным разработчика, это сокращает время написания кода на 55%. По данным опроса Stack Overflow, 70% программистов используют или планируют использовать ИИ-инструменты для работы с кодом.


2023. Meta в партнёрстве с Microsoft выпустила открытую языковую ИИ-модель Llama 2



Meta и Microsoft представили Llama 2 — большую языковую модель нового поколения (open-source альтернативу GPT-4). Новая версия будет доступна для исследовательских и коммерческих целей, поддерживая открытый подход к разработке и распространению современных моделей ИИ. Это станет новым шагом в долгосрочном партнёрстве между двумя компаниями, направленном на расширении доступа к базовым технологиям ИИ по всему миру. Meta утверждает, что в бизнес-сфере языковая модель Llama 1 уже пользуется огромным спросом. Новая версия Llama 2 будет доступна в каталоге моделей Azure AI, что позволит разработчикам, использующим Microsoft Azure, работать с ней и использовать инструменты облачных технологий для фильтрации контента и функций безопасности.


2023. ИИ-стартап Hugging Face и ServiceNow выложили в открытый доступ нейросеть для бесплатной генерации кода



StarCoder — это альтернатива сервисам вроде Copilot, который компания GitHub выпустила как «напарника программистов». Использовать модель StarCoder с 15 млрд параметров можно бесплатно — в том числе для корпоративных задач, без необходимости отчислять роялти. Её обучали на более чем 80 языках программирования, а также текстах и документации из репозиториев GitHub. StarCoder совместим с редактором кода Visual Studio Code от Microsoft и, как и чат-бот ChatGPT, может отвечать на вопросы о программировании и выполнять базовые запросы — к примеру, «сгенерируй UI приложения». Hugging Face и ServiceNow предупредили, что StarCoder может выдавать «неточный, оскорбительный и сбивающий с толку контент» и, в отличие от Copilot, не может похвастаться изобилием функций. Но доработать модель теперь поможет сообщество.


2023. Stable Diffusion опубликовал исходный код языковых моделей StableLM



Разработчик ИИ-генератора Stable Diffusion опубликовал на Github исходный код двух языковых моделей StableLM. Это набор альфа-версий языковых моделей с 3 млрд и 7 млрд параметров. Разработчики могут «изучать, использовать и адаптировать» продукт для коммерческих и исследовательских целей в соответствии с лицензией Creative Commons Attribution-Share Alike 4.0 — то есть с указанием авторства и изменений. С помощью StableLM можно генерировать текст и код. Модели обучали на «экспериментальном» наборе данных The Pile — он содержит информацию из разных источников вроде Wikipedia, Stack Exchange, PubMed и других, отметило The Verge. «Изобилие» данных позволило компании, по её же словам, добиться «хорошей результативности» при наличии небольшого числа параметров: 3 и 7 млрд против 175 млрд у GPT-3.


2023. Google представила открытый аналог ChatGPT для обучения автономных роботов



Google представил открытую мультимодальную языковую модель на основе искусственного интеллекта для обучения автономных роботов - PaLM-E. Модель объединяет язык и компьютерное зрение для управления роботами. В общей сложности, как отмечается, доступны 562 млрд параметров, что обеспечивает максимальную гибкость. Модель, в частности, позволяет роботу выполнять широкий спектр задач на основе голосовых команд человека без необходимости постоянного переобучения. Иными словами, робот воспринимает директивы на естественном языке, анализирует их и немедленно приступает к работе. Например, если роботу приказано «принеси мне рисовые чипсы из ящика стола», PaLM-E оперативно создаст план действий на основе команды и своего поля зрения. Затем мобильная роботизированная платформа с автоматизированной рукой полностью автономно выполнит все необходимые операции.


2022. Microsoft открыла исходники ИИ-системы для фермеров



Microsoft открыла доступ к FarmVibes.AI, сборнику моделей искусственного интеллекта, которые владельцы ферм могут использовать для более эффективного выполнения сельскохозяйственных задач. Набор инструментов FarmVibes.AI включает в себя четыре инструмента. Первый, Async Fusion, способен объединять данные с датчиков фермы со спутниковыми и беспилотными снимками. Он облегчает создание карт фермы, которые можно использовать для определения оптимального способа выполнения сельскохозяйственных задач. Второй, SpaceEye, облегчает обработку спутниковых данных, используемых в картах ферм. Третий, DeepMC помогает фермерам прогнозировать температуру и скорость ветра, опираясь на прогнозы метеостанций и датчики фермы. Четвертый - помогает операторам ферм в реализации инициатив по экологической устойчивости.


2022. Stable Diffusion - open-source альтернатива DALL·E 2



Компания Stability.ai объявила о публичном релизе модели графической нейросети Stable Diffusion. В отличие от сравнимых с ней по качеству DALL·E 2 и Midjourney, нейросеть Stable Diffusion имеет открытый исходный код. Поэтому любой желающий может бесплатно создавать на её основе приложения для решения конкретных задач по преобразованию текста в изображение. Кроме того, в отличие от сопоставимых по открытости кода DALL·E mini (Craiyon) и Disco Diffusion, Stable Diffusion позволяет создавать фотореалистичные и эстетичные произведения искусства, не уступающие по качеству моделям OpenAI и Google. Stable Diffusion воплощает всё лучшее, что есть в нейросетях мира искусства: это, возможно, лучшая из существующих графических нейросетей с открытым исходным кодом. Она пока не имеет аналогов, и её, без сомнения, ждёт большое будущее.


2022. Facebook выложил в открытый доступ ИИ-технологию для перевода текстов на 200 языков



Марк Цукерберг рассказал, что его компания открыла исходных код ИИ-модели, которая может переводить текст на 200 языков. По его словам, у многоязычной модели более 50 млрд параметров, её обучали с помощью суперкомпьютера Research SuperCluster. Достижения в этой области позволят выполнять более 25 млрд переводов в день в приложениях компании, написал Цукерберг. Это часть проекта No Language Left Behind (NLLB), который компания анонсировала в начале 2022 года. В частности, модель NLLB-200 может выполнять «высококачественные» переводы на 55 африканских языков.


2020. Microsoft выпустила open-source инструмент для глубокого обучения на основе триллиона параметров



Microsoft представила на GitHub обновленную открытую версию библиотеки DeepSpeed. Она предназначена для оптимизации глубокого обучения моделей искусственного интеллекта. Уникальность решения DeepSpeed заключается в том, что она способна обучать модели ИИ на основе триллиона различных параметров. В Microsoft отмечают, что используемый разработчиками DeepSpeed метод, который получил название 3D-параллелизм, адаптируется к различным требованиям пользовательских решений, включая взаимодействие с огромными моделями, сохраняя при этом баланс и эффективность в масштабировании.


2020. Mycroft - open-source голосовой ассистент


Американский стартап Mycroft хочет конкурировать с Google Now, Siri и Alexa за счет того, что предлагает open-source альтернативу этим виртуальным ассистентам. "ИИ должен быть открытым, а данные должны быть конфиденциальны" - говорят создатели стартапа. Однако, не смотря на то, что код Mycroft действительно открыт, работает он, в основном (кроме клиентских приложений) - на серверах Mycroft, и что там происходит - никто не знает. Зарабатывает стартап на продаже своей умной колонки Mark. Позиционирует ее как для домашнего использования, так и для бизнеса. Пока этот ассистент знает только английский


2020. Google выпустил open-source платформу, которая сокращает расходы на машинное обучение на 80%



Google выпустил фреймворк с открытым исходным кодом SEED RL, которая позволяет масштабировать обучение ИИ-модулей на тысячах компьютеров. Это решение, по словам разработчиков, позволяет снижать расходы на 80%, благодаря чему стартапы могут создавать алгоритмы на уровне продуктов крупных технологических компаний. Фреймворк SEED RL построен на платформе TensorFlow 2.0 и использует комбинацию графических и тензорных модулей для централизации модели логического вывода. Вывод затем выполняется с использованием компонента, который обучает модель.


2018. IBM Security Connect - облачная платформа безопасности, основанная на открытых технологиях, управляемая ИИ



Компания IBM разработала платформу IBM Security Connect - первую (по их мнению) облачную платформу безопасности, основанную на открытых технологиях и управляемую ИИ. Поскольку платформа является открытой, ее пользователи смогут создавать решения и небольшие сервисы для внедрения в свои проекты. У них будет даже доступ к суперкомпьютеру IBM Watson, который использует нейронные сети и глубокое машинное обучение. Одной из основных технологий, которая лежит в основе платформы, является проект STIX-Shifter (Structured Threat Information eXpression) — протокол, используемый для безопасного обмена информацией об угрозах. Он обеспечивает согласованность передачи данных во всех продуктах IBM Security Connect для глубокой аналитики. В сочетании с огромными массивами данных, которые предоставляют один общий API, программа может использовать информацию из любого источника. Ну и что касается интеграции в систему искусственного инителлекта. По словам господина Корбина, абсолютно не важно, по какой системе устроена нейронная сеть. Все они будут совместимы между собой.


2016. Intel купила разработчика библиотеки компьютерного зрения OpenCV



Open-source библиотека алгоритмов компьютерного зрения OpenCV известна, пожалуй, всем кто интересуется технологиями машинного обучения. Однако, далеко не все знают, что большинство ведущих разработчиков OpenCV живут и трудятся в Нижнем Новгороде, и являются сотрудниками компании Itseez. С 2000 по 2008 год OpenCV разрабатывалась и поддерживалась в основном Intel. Однако, затем Intel практически прекратила поддержку проекта, и он выживал благодаря спонсорству компаний Willow Garage и NVidia. Теперь же в Intel опять сильно заинтересовались машинным обучением и компьютерным зрением и решили выкупить старый знакомый стартап.


2015. Элон Маск создал организацию OpenAI для контроля ИИ



Как известно, Элон Маск побаивается искусственного интеллекта. Поэтому он с друзьями, в число которых входят сооснователь PayPal Питер Тиль, партнёр Y Combinator Сэм Альтман основали некоммерческую организацию OpenAI, целью которой станет контроль человечества над искусственным интеллектом (чтоб он случайно нас не уничтожил). Со старта в эту организацию друзья вложили не многи ни мало $1 млрд. Как же контролировать ИИ? Очень просто - нужно владеть информацией о нем: знать его силы и слабости. Поэтому OpenAI будет заниматься исследованиями ИИ, а полученной информацией будет делиться со всеми людьми (ведь все мы находимся по одну сторону баррикады).***


2015. Google открыл код своей системы машинного обучения TensorFlow


Google преобразовал свою систему машинного обучения TensorFlow в проект с открытым исходным кодом. TensorFlow позволяет создавать и обучать нейросети и используется компанией в сервисах распознавания устной речи, написания автоматических ответов в электронной почте и для распознавания картинок в Google Photos. Представители Google отмечают, что решения, разработанные при помощи TensorFlow, легко масштабируются в зависимости от имеющихся аппаратных ресурсов, поэтому платформа может принести пользу как научно-исследовательским организациям, так и энтузиастам машинного обучения. ***