Современный автоматический перевод - совершенно не программирование. Раньше был декодер и энкодер с кучей руками написанных правил, в соответствии со всякой филологией. Нонче же жуткого размера и сложности LSTM в несколько этажей и Attention сеть сбоку, с одной стороны текст на одном языке пихают, с другой стороны перевод вылезает. И никто толком не понимает, как именно это работает.
Учат эту сеть на параллельных текстах, которых к сожалению немного. Особенно для редких языков вроде чешского. Библия и всякие бюрократические документы Европейского Союза, которые положено по закону на все языки переводить.
Времена меняются
Учат эту сеть на параллельных текстах, которых к сожалению немного. Особенно для редких языков вроде чешского. Библия и всякие бюрократические документы Европейского Союза, которые положено по закону на все языки переводить.