Логотип

АРМЕНИЯ В ИГРЕ

Электронный переводчик для армянского языка

Он продал недвижимость, чтобы выплачивать зарплату своим сотрудникам, работающим над созданием интеллектуального продукта. Сегодня профессор Эдик МАНУКЯН ни о чем не жалеет, кроме потерянного в холодные 90-е зрения

Армения — единственная страна в мире, где так широко и массово празднуется профессиональный праздник переводчиков —  Таргманчац тон. В 405 году переводом Библии Месропом Маштоцем и его учениками началась история армянской письменности. "По милости наших блаженных отцов (Маштоц и Саак Партев) заговорили по-армянски книги Моисея, пророки, послания Павла и других апостолов, Евангелие, – пишет Корюн. – Страна наша посредством этих переводов весьма быстро узнала не только прошлое, но и изначальную вечность и позднее пришедшее, начало и конец и все божественные предания".

Сегодня, в эру информационных и высоких технологий, ценность работы переводчиков никак не ниже, чем в далеком V веке. Более того, наряду с "живыми" переводчиками научная мысль работает над созданием электронных переводчиков. Когда доктор технических наук, профессор вычислительного департамента Государственного инженерного университета Армении Эдик Манукян заявил, что начинает работать над созданием первого в нашей стране электронного переводчика, коллеги его засмеяли. Дело в том, что академические институты Армении пытались решить эту задачу еще в 60-е годы, когда наука была на подъеме. Но не получилось. А Э.Манукян получил первые результаты спустя три года после начала работы – в 2003 году. Стремление создать онлайн-переводчик для армянского языка сам профессор объясняет незатейливо – интернет и глобализация. "Англоязычный интернет является угрозой минимизации роли родного языка. А язык, наподобие, земли необходимо защищать и бороться за него. Когда мы приступили к реализации этой идеи, нас коллеги засмеяли. А к 2003 году удалось создать интеллектуальную программу и получить первые результаты", — рассказывает Э.Манукян.

Перевод – это целая наука. Взвалить эту творческую работу на машину не так уж и просто. "Железо" необходимо научить думать при переводе. В противном случае получится малологичный и несвязный набор слов. Мир придумал пока один механизм решения этой задачи. В частности, это создание математического языка-посредника между двумя рабочими языковыми системами. Последние связываются посредством зашифрованного в цифры концепта.

"Каждое слово, каждое понятие мы описываем в программе, приводим их толкование. К примеру, слово "стол" не просто переведено, как table. Оно описано как предмет мебели, имеющий плоскую поверхность, ножки, состоящий из горящего материала, его возможно перемещать. Таким образом, машина, переводя фразу "сидеть за столом", понимает, что стол является предметом мебели и за ним можно сидеть или на него можно поставить что-либо, поскольку предмет плоский. Но фразу "съесть стол" переводчик проигнорирует, поскольку в его описании нет свойства, позволяющего употреблять предмет в пищу даже в переносном смысле", — рассказывает математик.

В мире программистов зашифрованный язык-посредник принято называть Union network languishes (UNL). Для создания подобной системы японские ученые в 90-е годы потратили 360 млн долларов, но европейцы не приняли результаты их работы. В настоящее время научный мир идет к созданию языкового стандарта, который будет заложен в основу интернациональной, универсальной языковой системы. Когда у Э.Манукяна возникла идея создания электронного переводчика для армянского языка независимо от мировых тенденций и результатов аналогичных работ, он также пошел по этому пути – шифрованию исходного языка в переходную цифро-лингвистическую систему и расшифровки до второго языка. Пока мир работает над созданием стандартов, а когда они будут, армянский профессор обещает с легкостью встроить свое детище в мировые стандарты. Так что Армения в игре, а не на периферии. Академический институт имеет свою разработку – расшифровку от UNL к армянскому языку. Но в его основе лежат японские стандарты UNL, которые мир не принял. Кроме того, 95-96% сложности работы состоит в шифровке исходного языка на UNL, а не его расшифровка до конечного языка, отмечает Э.Манукян.

Для реализации проекта ученый привлек все свои сбережения, продал кое-что из имущества и направил все средства на создание программы. Впоследствии ему удалось привлечь грантовые средства от фонда "Евразия", чему во многом способствовало то, что, в отличие от иных участников конкурса, у него уже были конкретные результаты.

Прекрасно осознавал значимость этой программы и покойный премьер-министр Андраник Маргарян. Тогда правительство выделило 20 млн драмов на продолжение проекта. На эти средства удалось закупить оборудование и запустить онлайн-переводчик в интернет. По адресу www.translator.am можно в онлайн-режиме переводить слова и тексты с армянского на английский и наоборот. В ближайшем будущем руководители проекта обещают добавить инструмент, позволяющий переводить целые интернет-странички. Сегодня сайт посещают до 200 человек, и количество пользователей растет. Рост числа пользователей сопряжен с определенными финансовыми проблемами, поскольку чем больше людей пользуется сайтом, тем больше расходуется трафик и, соответственно, затраты на хостинг растут.

В настоящее время ученые описали в программе более 40 тысяч понятий (не путать со словами). Но программа все время совершенствуется: обогащается словарь, повышаются "интеллектуальные" способности переводчика. Э.Манукян планирует включить в программу и западноармянский язык. Но для всего этого необходимо соответствующее финансирование. "По всему миру тратятся миллиарды долларов на подобные программы. В прошлом году Европейский Союз выделил $1,2 млрд на создание англо-испано-китайского электронного переводчика", — сетует ученый. В то же время он указывает, что в регионе только Армения работает над своим электронным переводчиком. У Грузии его пока нет, а Азербайджан в прошлом году купил технологию у российских разработчиков. Армянская же разработка "умнее" российской, что признается и учеными из лаборатории машинного перевода Российской академии наук.