Да, плохо. Но другого такого универсального нет. К тому же, есть люди, которые переводят еще хуже. Как и они, Google translate хорош своей способностью к обучению. Конечно, "понимать" он от такого обучения больше не станет, но, просто за счет запоминания, воспроизводить сложные тексты на другом языке будет лучше.
Что касается морфологических категорий, то их можно добавить. Байесовские экспертные системы, подобно живым организмам, в некоторой степени обладают свойством эквифинальности. Можно просто "бросить в котел" все возможные дополнительные признаки и система в процессе обучения сама выделит те, которые (возможно в совокупности) коррелируют с правильным ответом.
Конкретный пример: Программе spamassassin, сочетает в себе байесовскую экспертную систему и экспертную систему, построенную на явных правилах. Причем, в ней есть огромное количество явных правил, которые никак не влияют на конечный "счет" (спам/не спам) анализируемого сообщения. Зачем они ? Дело в том, что все "сработавшие" явные правила, независимо от их счета, скармливаются байесовскому классификатору и уже он сам динамически определяет их значимость.
Таким образом можно ввести явные морфологические признаки и в систему статистического перевода. Причем, не обязательно в виде явных правил, а, например, в виде такой-же самообучающейся экспертной системы, которая классифицировала бы каждое слово и слова в предложении. Результат этой классификации можно потом "вбросить" в сам переводчик, дополнительно к тексту.
no subject
Что касается морфологических категорий, то их можно добавить. Байесовские экспертные системы, подобно живым организмам, в некоторой степени обладают свойством эквифинальности. Можно просто "бросить в котел" все возможные дополнительные признаки и система в процессе обучения сама выделит те, которые (возможно в совокупности) коррелируют с правильным ответом.
Конкретный пример: Программе spamassassin, сочетает в себе байесовскую экспертную систему и экспертную систему, построенную на явных правилах. Причем, в ней есть огромное количество явных правил, которые никак не влияют на конечный "счет" (спам/не спам) анализируемого сообщения. Зачем они ? Дело в том, что все "сработавшие" явные правила, независимо от их счета, скармливаются байесовскому классификатору и уже он сам динамически определяет их значимость.
Таким образом можно ввести явные морфологические признаки и в систему статистического перевода. Причем, не обязательно в виде явных правил, а, например, в виде такой-же самообучающейся экспертной системы, которая классифицировала бы каждое слово и слова в предложении. Результат этой классификации можно потом "вбросить" в сам переводчик, дополнительно к тексту.
К.Л.М.