http://dr-klm.livejournal.com/ ([identity profile] dr-klm.livejournal.com) wrote in [personal profile] dr_klm 2011-03-22 02:49 pm (UTC)

Да, плохо. Но другого такого универсального нет. К тому же, есть люди, которые переводят еще хуже. Как и они, Google translate хорош своей способностью к обучению. Конечно, "понимать" он от такого обучения больше не станет, но, просто за счет запоминания, воспроизводить сложные тексты на другом языке будет лучше.

Что касается морфологических категорий, то их можно добавить. Байесовские экспертные системы, подобно живым организмам, в некоторой степени обладают свойством эквифинальности. Можно просто "бросить в котел" все возможные дополнительные признаки и система в процессе обучения сама выделит те, которые (возможно в совокупности) коррелируют с правильным ответом.

Конкретный пример: Программе spamassassin, сочетает в себе байесовскую экспертную систему и экспертную систему, построенную на явных правилах. Причем, в ней есть огромное количество явных правил, которые никак не влияют на конечный "счет" (спам/не спам) анализируемого сообщения. Зачем они ? Дело в том, что все "сработавшие" явные правила, независимо от их счета, скармливаются байесовскому классификатору и уже он сам динамически определяет их значимость.

Таким образом можно ввести явные морфологические признаки и в систему статистического перевода. Причем, не обязательно в виде явных правил, а, например, в виде такой-же самообучающейся экспертной системы, которая классифицировала бы каждое слово и слова в предложении. Результат этой классификации можно потом "вбросить" в сам переводчик, дополнительно к тексту.

К.Л.М.

Post a comment in response:

This account has disabled anonymous posting.
If you don't have an account you can create one now.
HTML doesn't work in the subject.
More info about formatting