Open-source ИИ

Обновлено: 12.10.2022
ИИ платформы, библиотеки и фреймворки с открытым исходным кодом.

2022. Microsoft открыла исходники ИИ-системы для фермеров



Microsoft открыла доступ к FarmVibes.AI, сборнику моделей искусственного интеллекта, которые владельцы ферм могут использовать для более эффективного выполнения сельскохозяйственных задач. Набор инструментов FarmVibes.AI включает в себя четыре инструмента. Первый, Async Fusion, способен объединять данные с датчиков фермы со спутниковыми и беспилотными снимками. Он облегчает создание карт фермы, которые можно использовать для определения оптимального способа выполнения сельскохозяйственных задач. Второй, SpaceEye, облегчает обработку спутниковых данных, используемых в картах ферм. Третий, DeepMC помогает фермерам прогнозировать температуру и скорость ветра, опираясь на прогнозы метеостанций и датчики фермы. Четвертый - помогает операторам ферм в реализации инициатив по экологической устойчивости.


2022. Stable Diffusion - open-source альтернатива DALL·E 2



Компания Stability.ai объявила о публичном релизе модели графической нейросети Stable Diffusion. В отличие от сравнимых с ней по качеству DALL·E 2 и Midjourney, нейросеть Stable Diffusion имеет открытый исходный код. Поэтому любой желающий может бесплатно создавать на её основе приложения для решения конкретных задач по преобразованию текста в изображение. Кроме того, в отличие от сопоставимых по открытости кода DALL·E mini (Craiyon) и Disco Diffusion, Stable Diffusion позволяет создавать фотореалистичные и эстетичные произведения искусства, не уступающие по качеству моделям OpenAI и Google. Stable Diffusion воплощает всё лучшее, что есть в нейросетях мира искусства: это, возможно, лучшая из существующих графических нейросетей с открытым исходным кодом. Она пока не имеет аналогов, и её, без сомнения, ждёт большое будущее.


2022. Террористобук выложил в открытый доступ ИИ-технологию для перевода текстов на 200 языков



Марк Цукерберг рассказал, что его компания открыла исходных код ИИ-модели, которая может переводить текст на 200 языков. По его словам, у многоязычной модели более 50 млрд параметров, её обучали с помощью суперкомпьютера Research SuperCluster. Достижения в этой области позволят выполнять более 25 млрд переводов в день в приложениях компании, написал Цукерберг. Это часть проекта No Language Left Behind (NLLB), который компания анонсировала в начале 2022 года. В частности, модель NLLB-200 может выполнять «высококачественные» переводы на 55 африканских языков.


2022. Яндекс выложил GPT-подобную нейросеть YaLM 100B в свободный доступ



Яндекс выложил в свободный доступ свою самую большую модель YaLM на 100 млрд параметров. Она обучалась 65 дней на 1,7 ТБ текстов из интернета, книг и множества других источников с помощью 800 видеокарт A100. Модель и дополнительные материалы опубликованы на Гитхабе под лицензией Apache 2.0, которая допускает применение как в исследовательских, так и в коммерческих проектах. Сейчас это самая большая в мире GPT-подобная нейросеть в свободном доступе как для английского, так и для русского языков.


2020. Microsoft выпустила open-source инструмент для глубокого обучения на основе триллиона параметров



Microsoft представила на GitHub обновленную открытую версию библиотеки DeepSpeed. Она предназначена для оптимизации глубокого обучения моделей искусственного интеллекта. Уникальность решения DeepSpeed заключается в том, что она способна обучать модели ИИ на основе триллиона различных параметров. В Microsoft отмечают, что используемый разработчиками DeepSpeed метод, который получил название 3D-параллелизм, адаптируется к различным требованиям пользовательских решений, включая взаимодействие с огромными моделями, сохраняя при этом баланс и эффективность в масштабировании.


2020. Mycroft - open-source голосовой ассистент


Американский стартап Mycroft хочет конкурировать с Google Now, Siri и Alexa за счет того, что предлагает open-source альтернативу этим виртуальным ассистентам. "ИИ должен быть открытым, а данные должны быть конфиденциальны" - говорят создатели стартапа. Однако, не смотря на то, что код Mycroft действительно открыт, работает он, в основном (кроме клиентских приложений) - на серверах Mycroft, и что там происходит - никто не знает. Зарабатывает стартап на продаже своей умной колонки Mark. Позиционирует ее как для домашнего использования, так и для бизнеса. Пока этот ассистент знает только английский


2020. Google выпустил open-source платформу, которая сокращает расходы на машинное обучение на 80%



Google выпустил фреймворк с открытым исходным кодом SEED RL, которая позволяет масштабировать обучение ИИ-модулей на тысячах компьютеров. Это решение, по словам разработчиков, позволяет снижать расходы на 80%, благодаря чему стартапы могут создавать алгоритмы на уровне продуктов крупных технологических компаний. Фреймворк SEED RL построен на платформе TensorFlow 2.0 и использует комбинацию графических и тензорных модулей для централизации модели логического вывода. Вывод затем выполняется с использованием компонента, который обучает модель.


2018. IBM Security Connect - облачная платформа безопасности, основанная на открытых технологиях, управляемая ИИ



Компания IBM разработала платформу IBM Security Connect - первую (по их мнению) облачную платформу безопасности, основанную на открытых технологиях и управляемую ИИ. Поскольку платформа является открытой, ее пользователи смогут создавать решения и небольшие сервисы для внедрения в свои проекты. У них будет даже доступ к суперкомпьютеру IBM Watson, который использует нейронные сети и глубокое машинное обучение. Одной из основных технологий, которая лежит в основе платформы, является проект STIX-Shifter (Structured Threat Information eXpression) — протокол, используемый для безопасного обмена информацией об угрозах. Он обеспечивает согласованность передачи данных во всех продуктах IBM Security Connect для глубокой аналитики. В сочетании с огромными массивами данных, которые предоставляют один общий API, программа может использовать информацию из любого источника. Ну и что касается интеграции в систему искусственного инителлекта. По словам господина Корбина, абсолютно не важно, по какой системе устроена нейронная сеть. Все они будут совместимы между собой.


2016. Intel купила разработчика библиотеки компьютерного зрения OpenCV



Open-source библиотека алгоритмов компьютерного зрения OpenCV известна, пожалуй, всем кто интересуется технологиями машинного обучения. Однако, далеко не все знают, что большинство ведущих разработчиков OpenCV живут и трудятся в России, в городе Нижний Новгород, и являются сотрудниками компании Itseez. С 2000 по 2008 год OpenCV разрабатывалась и поддерживалась в основном Intel. Однако, затем Intel практически прекратила поддержку проекта, и он выживал благодаря спонсорству компаний Willow Garage и NVidia. Теперь же в Intel опять сильно заинтересовались машинным обучением и компьютерным зрением и решили выкупить старый знакомый стартап.


2015. Элон Маск создал организацию OpenAI для контроля ИИ



Как известно, Элон Маск побаивается искусственного интеллекта. Поэтому он с друзьями, в число которых входят сооснователь PayPal Питер Тиль, партнёр Y Combinator Сэм Альтман основали некоммерческую организацию OpenAI, целью которой станет контроль человечества над искусственным интеллектом (чтоб он случайно нас не уничтожил). Со старта в эту организацию друзья вложили не многи ни мало $1 млрд. Как же контролировать ИИ? Очень просто - нужно владеть информацией о нем: знать его силы и слабости. Поэтому OpenAI будет заниматься исследованиями ИИ, а полученной информацией будет делиться со всеми людьми (ведь все мы находимся по одну сторону баррикады).***


2015. Google открыл код своей системы машинного обучения TensorFlow


Google преобразовал свою систему машинного обучения TensorFlow в проект с открытым исходным кодом. TensorFlow позволяет создавать и обучать нейросети и используется компанией в сервисах распознавания устной речи, написания автоматических ответов в электронной почте и для распознавания картинок в Google Photos. Представители Google отмечают, что решения, разработанные при помощи TensorFlow, легко масштабируются в зависимости от имеющихся аппаратных ресурсов, поэтому платформа может принести пользу как научно-исследовательским организациям, так и энтузиастам машинного обучения. ***