dr_klm: (Default)
[personal profile] dr_klm
Применение самообучаемых байесовских экспертных систем в области машинного перевода привело к статистической (и стохастической) революции (благодаря которой, в частности, появился сайт http://translate.google.com/). Современное определение искусственного интеллекта дается в терминах взаимодействия агента и среды, которые по-сути говорят об одном и том-же (будущем, которое и для среды и для агента общее), но на своих языках (среда общается с агентом языком сенсоров, агент соответствующим образом отвечает языком приказов своим исполнительным устройствам). Аватар 2.0, это еще один агент, который, пассивно наблюдая за этой беседой, строит свою модель поведения основного агента в контексте среды. При достаточной формализации взаимодействия агента (человека) и среды (например, таком как в компьютерных играх-песочницах типа DF или X), это не должно быть намного сложнее машинного перевода (что позволило бы превратить песочницы в MMO(ffline)RPG, с возможностью offline дообучения на примере отдельных сложных для предыдущей версии агента, т.е. "интересных" ситуаций). Могут быть и вполне серьезные применения.

Интересно, кто-нибудь думал уже в этом направлении ?

update (27.03.2011): Как говорилось в обсуждении, решение одной задачи AI, тянет за собой другие. Вот, свежий пример, распознаватель поз Kinect (популярно, детально). И над всем этим витает дух того самого известного пресвитерианского священника. ;-)

update (16.06.2011) А вот и исследователи из Университета Северной Каролины пришли к той-же идее. Судя по PR, ничего кроме идеи они пока и не опубликовали (корреляция между достижениями -- это только повод высказаться).

Date: 2011-03-21 08:04 pm (UTC)
From: (Anonymous)
с немецкого на английский и обратно гуглопереводчик переводит очень плохо.
я иногда поражаюсь насколько плохо! все-таки без "понимания" что такое род, число, время получить грамотный перевод сложно.

Date: 2011-03-22 02:49 pm (UTC)
From: [identity profile] dr-klm.livejournal.com
Да, плохо. Но другого такого универсального нет. К тому же, есть люди, которые переводят еще хуже. Как и они, Google translate хорош своей способностью к обучению. Конечно, "понимать" он от такого обучения больше не станет, но, просто за счет запоминания, воспроизводить сложные тексты на другом языке будет лучше.

Что касается морфологических категорий, то их можно добавить. Байесовские экспертные системы, подобно живым организмам, в некоторой степени обладают свойством эквифинальности. Можно просто "бросить в котел" все возможные дополнительные признаки и система в процессе обучения сама выделит те, которые (возможно в совокупности) коррелируют с правильным ответом.

Конкретный пример: Программе spamassassin, сочетает в себе байесовскую экспертную систему и экспертную систему, построенную на явных правилах. Причем, в ней есть огромное количество явных правил, которые никак не влияют на конечный "счет" (спам/не спам) анализируемого сообщения. Зачем они ? Дело в том, что все "сработавшие" явные правила, независимо от их счета, скармливаются байесовскому классификатору и уже он сам динамически определяет их значимость.

Таким образом можно ввести явные морфологические признаки и в систему статистического перевода. Причем, не обязательно в виде явных правил, а, например, в виде такой-же самообучающейся экспертной системы, которая классифицировала бы каждое слово и слова в предложении. Результат этой классификации можно потом "вбросить" в сам переводчик, дополнительно к тексту.

К.Л.М.

Profile

dr_klm: (Default)
Dr. K. L. Metlov

March 2017

S M T W T F S
   1234
567891011
1213141516 1718
19202122232425
262728293031 

Most Popular Tags

Page Summary

Style Credit

Expand Cut Tags

No cut tags
Page generated May. 13th, 2025 09:28 am
Powered by Dreamwidth Studios