Яндекс создал "гибрид" искусственного интеллекта для перевода текстов


Опубликованно 18.09.2017 00:40

Яндекс создал

МОСКВА, 14 Сен — РИА Новости. Специалисты "Яндекса" создали новую систему онлайн-перевода, который использует одновременно и старые статистических алгоритмов и искусственного интеллекта, сообщает пресс-служба компании.

"В то время как наша новая система поддерживает только перевод с английского на русский. В ближайшее время мы начнем добавлять другие языковые пары и в течение нескольких месяцев, осуществляем поддержку большинства самых популярных языков", - отметили в пресс-службе "Яндекса", в ответ на вопросы корреспондента РИА Новости.

В последние годы, лидеры IT-компании начали активно развивать и использовать различные формы искусственного интеллекта для поиска информации в Интернете, обработки фотографий и их каталогизации и многих других целей, где неклассические алгоритмы обработки данных не работают.

Ярким примером такого подхода является система искусственного интеллекта AlphaGo, Open обыгравшая чемпионов Европы и мира, поколения и анонимно победителя, сотни игроков в онлайн-систем этой древнекитайской игры.

Большая часть этого развития основан в, так называемых, глубоких или сверточных нейросетях. Представляют собой каскады или многослойные структуры из нескольких десятков или сотен более простых нейросетей. Каждый из них не обрабатывает исходные данные и продуктов, анализ, полученные из сети сверху, что дает возможность упростить очень сложные проблемы и решать их с помощью сравнительно скромные вычислительные ресурсы.

Нечто подобное происходит и при использовании искусственного интеллекта для перевода с одного языка на другой. Когда нейросеть "читает" перевести текст, это не перевод по фразам или отдельным словам, и "поиск" - ответ полный, с использованием данных, полученных в анализе текстов, переведенных человеком.

У этого подхода, как отмечают специалисты "Яндекса", есть и плюсы и минусы: в этот тип текста более читабельным и, подобно тому, как был переведен человек, но, с другой стороны, машина периодически начинает "фантазировать", если в ней находятся редкие слова и фразы.

Эта проблема "Яндекса" решил, сочетание искусственного интеллекта со старой системой перевода, хорошо справлявшейся с редкими словами, но сталкивавшейся с большими проблемами при их объединении в предложения. Когда пользователь вводит текст, и в то же время переводит, и нейросеть, и статистический алгоритм, после чего система машинного обучения CatBoost, недавно созданная "Яндексом", сопоставляет результаты и получает из них, самый читаемый и грамотный вариант.

Теперь старая версия "Яндекс.Переводчик поддерживает 94 языка, в том числе ряд редких и вымышленных, например, синдарин — язык эльфов из книг Роулинг. Р. Р. Толкина.



Категория: Технологии