Искусственный интеллект для перевода

Обновлено: 17.04.2023
Технологии машинного обучения нейросетей позволяют переводить тексты с использованием распознавания смыслов (а не только словари и статистические методы). Таким образом, существенно повышается качество переведенного текста. Примеры использования ИИ для переводов - приведены ниже.

2023. Яндекс Браузер добавил автоматический перевод видео с китайского языка


Учить китайский язык и разбираться в китайской экономике теперь полезно всем россиянам (кроме тех, кому придет электронная повестка на фронт). Поэтому Яндекс добавил полезную фичу в свой Браузер - автоперевод видео с китайского на русский на Youtube. Причем, браузер автоматически накладывать русскую озвучку на китайскую речь. Разработчики даже обучили нейросеть понимать четыре тона, которые в китайском определяют смысл сказанного. Тон — это мелодический рисунок голоса, каждый слог с повышением или понижением голоса может означать разные вещи. Яндекс Браузер сам предложит перевести видео с китайского на YouTube после того, как пользователь его откроет. Для этого ему нужно нажать кнопку «Перевести видео». «Чуть позже» компания добавит перевод для китайской видеоплатформы Bilibili.


2023. Онлайн-переводчик DeepL представил ИИ-помощника Write для исправления ошибок в тексте



Немецкая компания DeepL выпустила бета-версию DeepL Write — ИИ-помощника для написания текстов на иностранном языке. Как и подобный сервис Grammarly, этот инструмент исправляет грамматические ошибки и предлагает варианты, чтобы улучшить стиль или подобрать более точные слова. Команда решила запустить инструмент, заметив, что пользователи часто переводят текст со своего языка на иностранный и обратно, чтобы отловить возможные ошибки. Следующий шаг развития инструмента будет заключаться в том, чтобы сосредоточиться не на содержании текста, а на «неуловимых тонах и формулировках».


2022. Террористобук выложил в открытый доступ ИИ-технологию для перевода текстов на 200 языков



Марк Цукерберг рассказал, что его компания открыла исходных код ИИ-модели, которая может переводить текст на 200 языков. По его словам, у многоязычной модели более 50 млрд параметров, её обучали с помощью суперкомпьютера Research SuperCluster. Достижения в этой области позволят выполнять более 25 млрд переводов в день в приложениях компании, написал Цукерберг. Это часть проекта No Language Left Behind (NLLB), который компания анонсировала в начале 2022 года. В частности, модель NLLB-200 может выполнять «высококачественные» переводы на 55 африканских языков.


2021. Яндекс.Браузер теперь умеет переводить англоязычные видеоролики



В Яндекс.Браузере появилась функция автоматического перевод любых англоязычных видеороликов в YouTube, Vimeo, TikTok, Twitter, Facebook и «ВКонтакте». Обученная нейросеть определяет пол говорящего, переводит предложения на русский язык и синтезируют голос, после чего совмещают перевод с видеорядом. Перевод доступен в «Браузере» для Windows, macOS, Linux и Android и в приложении «Яндекс» для Android и iOS. Чтобы посмотреть видео в русской озвучке, нужно нажать на кнопку в плеере — процесс перевода занимает несколько минут, после чего пользователь получит уведомление. Пользователям доступно два голоса — женский (помощника «Алиса») и мужской. Пока перевод доступен только для видео на английском, но в будущем компания планирует добавить и другие языковые пары.


2020. В iOS 14 появился оффлайн-переводчик, выбор браузера, индикатор работающей камеры



Apple представил новую версию мобильной ОС iOS 14. Новая «Библиотека приложений» автоматически организует приложения по категориям ― как по папкам, только лучше. Также появится возможность скрывать целые экраны с приложениями на главной странице. В Apple Translate стало больше пар языков для перевода и возможность синхронного перевода, задействующая распознавание речи при помощи машинного обучения. Приложение может работать полностью оффлайн. Также, появился выбор браузера и почтового сервиса по умолчанию. До этого по умолчанию ссылки открывались только в Safari. Появилась возможность назначать различные команды на постукивание по задней крышке телефона. Появился индикатор работающей камеры или микрофона. Если какое-то приложение прямо сейчас использует вашу камеру, вы увидите в правом верхнем углу зеленую точку. Если использует микрофон — желтую.


2019. Promt выпустил корпоративный сервер переводов на основе нейронных сетей



Компания Promt представила решение для переводов, использующее технологии нейронных сетей и больших данных - PROMT Neural Translation Server. Современные системы машинного перевода используют, в основном, статистический либо нейронный метод. Promt Neural - использует гибридный подход, где свой вариант перевода предлагает и статистическая модель, и нейросеть. Разработанные компанией алгоритмы анализируют текст и решают, какая технология лучше подходит для перевода того или иного фрагмента текста. При этом по заявлениям разработчиков, система учитывает полный контекст предложения в исходном тексте и ранее созданный перевод. Такой подход, утверждают в Promt, обеспечивает перевод без «машинного акцента», наиболее приближенный к «человеческому». Стоимость решения может варьироваться в зависимости от требований клиента по кастомизации и числа пользователей.


2019. Google представил Translatotron - технологию синхронного перевода устной речи



Google представила новую технологию синхронного перевода устной речи — Translatotron. Обычно для перевода устной речи с одного языка на другой системы используют каскадную модель. Сначала система автоматически распознаёт речь для её транскрипции, затем осуществляется машинный перевод полученного текста, а после — преобразование текста в аудиозапись. Такая система в том числе используются в Google Translate. Новый экспериментальный алгоритм Google пропускает этап расшифровки речи в текст. Созданная разработчиками нейросеть принимает спектрограмму исходной аудиозаписи с голосом и синтезирует спектрограмму с речью на другом языке. Затем алгоритм синтезирует аудиофайл.


2019. Google представила технологию синхронного перевода устной речи Translatotron



Google представила Translatotron - технологию синхронного перевода устной речи, которая не выполняет этап расшифровки речи в текст и обратно (как это делается в Google Translate), а анализирует спектограмму источника и генерирует спектограмму на нужном языке. Кроме этого, такая система может сохранять интонацию и паузы оригинальной речи. В Google выделяют несколько преимуществ Translatotron. Технология может быстрее совершать перевод (по сравнению с «каскадными» системами), избавляется от возможных ошибок при распознавании текста и может лучше справляться со словами, которые не нуждаются в переводе (например, названия и имена собственные).


2019. Google Assistant научился синхронному переводу для 27 языков, включая русский


Виртуальный ассистент Google Assistant теперь может помочь легче общаться с иностранными партнерами и клиентами. В нем появился режим синхронного перевода на 27 языков, в числе которых есть и русский. Первым устройством с его поддержкой стал умный дисплей Google Home Hub. Чтобы активировать функцию, нужно попросить Asisstant побыть переводчиком на выбранный язык. Пока переводчик работает не идеально, поэтому кроме синхронного перевода, вы получите еще и смешные смыслы, которые создадут более расслабленную атмосферу для общения с иностранными партнерами и клиентами (как показано в видеоролике).


2017. Google представил беспроводные наушники со встроенным переводчиком


На большой презентации, вместе с новым телефоном, ноутбуком и прочими штучками, Google представил беспроводные наушники Pixel Buds за $159, которые предназначены для более близкого общения со своим голосовым помощником Google Assistant. На первый взгляд, это всего-лишь жалкая пародия на Apple Airpods + Siri. Однако, у Гугла есть большое преимущество - переводчик, который переводит речь в реальном времени. А с новыми наушниками вы сможете проводить переговоры с зарубежными партнерами, как Президент. Зафиксированная встроенным микрофоном речь на иностранном языке (а поддерживаются 40 языков) будет воспроизводиться на русском в наушниках. А ваш партнер будет слышать у себя в наушниках синхронный перевод вашей речи.


2016. Google Translate начинает использовать смысл для перевода



До сих пор Google Translate использовал статистический метод перевода. Он разбивал предложение на фразы, и анализируя миллионы ранее сделанных переводов, определял наиболее вероятный перевод данной фразы. Это работает гораздо лучше дословного перевода, однако все еще значительно хуже человеческого перевода. Новая версия сервиса, основанная на технологии Neural Machine Translation, переводит не слова, и не фразы, а целые предложения. Т.е. система извлекает из предложения объекты, события и связи между ними, а затем выражает смысл на другом языке. Она состоит из двух 8-слойных нейросетей, анализирующей и синтезирующей.Между нейросетями установлен дополнительный модуль внимания, который контролирует, чтоб  не пропускались редкие, но важные для смысла предложения слова. На данный момент новый алгоритм работает с 9 языками: английским, французским, немецким, испанским, португальским, китайским, японским, корейским и турецким. В будущем добавится поддержка всех 109 языков. ***


2016. Facebook отказалась от Bing Translator в пользу собственного переводчика



Facebook уже несколько лет предоставляет возможность перевода постов на ваш язык. До сих пор эта функция осуществлялась с помощью майкрософтовского переводчика Bing Translator, но в Facebook решили от него отказаться и разработали свой. Говорят, что Bing подходит для официальных текстов, но плохо справляется с обычными человеческими писаками, наполненными ошибками и фразеологизмами. Очевидно, для обучения переводчика Facebook использует свою огромную базу сообщений пользователей, т.е. все что вы пишите на Фейсбуке может быть использовано в качестве перевода других постов.


2015. Технология машинного перевода ABBYY Compreno пытается понять естественный язык



Как известно, самый популярный в мире автопереводчик Google Translate работает на статистическом принципе: он обучается на миллионах готовых переводов и каждый новый текст переводит на основе сформированных на опыте паттернов. Иногда получается смешно, но в целом это работает. А вот конкурирующая фирма - российская компания Abbyy не стала искать легких путей. Она уже более 20 лет работает над технологией Compreno, основой которой является создание синтаксической модели языка и понимание смысла текста. Т.е. каждое предложение Compreno разбивает на объекты и, определяя связи между ними, сначала формирует универсальный перевод на язык смысла, а затем уже выражает этот смысл на другом языке.


2010. Как работает Google Translate


Как вы знаете, онлайн переводчик Google Translate уже умеет переводить не только отдельные слова, но и целые предложения и тексты. И если вы рассмотрите эти переводы, вы увидите, что переведенные слова не всегда идут в том же порядке, что и исходные: переводчик старается сгенерировать предложения с учетом смысла и правил языка. Как он это делает? Человеку для перевода нужны самые разнообразные знания о мире и о языке. Но Google Translate использует другой хак: он анализирует миллионы текстов и их готовые переводы, сделанные людьми и формирует паттерны из часто встречающихся фраз. Чем больше переводов он обрабатывает, тем качественнее становится его собственный перевод.