Читаем без скачивания Журнал «Компьютерра» № 18 от 16 мая 2006 года - Компьютерра
Шрифт:
Интервал:
Закладка:
Неоспоримым преимуществом использования компьютера в работе переводчика является доступ к электронным справочным материалам. Первым моим электронным словарем, который стал большим подспорьем в работе, был англо-русский словарь Multilex 1.0 на базе бумажного общелексического словаря под редакцией Ю. Д. Апресяна. До сих пор многие переводчики хранят верность этому словарю, как «первой любви». Сейчас в продаже можно найти уже многоязычный Multilex 5.0 с множеством словарей и кучей дополнительных функций. Также на слуху у переводчиков словари под марками ECTACO и ETS , чьи терминологические базы в последних версиях исчисляются миллионами слов. Поэтому выбор словарей — дело вкуса или случая, то есть рекламы. Для себя, например, я выбрал связку из двух словарей. Первый — многоязычный Lingvo от ABBYY. С каждой версией он становится все объемнее и шустрее. Привлекает, что к основной базе можно подключать словари, созданные пользователями. Помимо известного списка на сайте www.lingvoda.ru, в Интернете можно найти сотни словарей по самым разным языковым парам и огромному числу тематик, а при желании и самому внести вклад в расширение базы бесплатных словарей. Для этого словарь поставляется вместе с компилятором языка DSL, позволяющим создавать в формате Lingvo собственные словари и делиться ими с другими переводчиками. Еще дальше по пути доступности пошел проект Multitran, в котором действует та же концепция открытой информационной системы, что и в Wikipedia. В отличие от отдельных словарей Lingvo, в Multitran работает принцип единого словаря, то есть все тематики, где встречается искомый термин, выдаются одним списком, благодаря чему упрощается пополнение словарной базы. Возможность оперативного добавления одиночных терминов делает процесс обновления словаря непрерывным. Опыт переводческого сообщества перенимается, если можно так выразиться, с колес. Основная сетевая версия словаря доступна по адресу www.multitran.ru, но есть и версия электронного словаря для Windows с возможностью пополнения новой лексикой через Интернет. Такая связка из двух электронных словарей прижилась не только на моем настольном компьютере, но и на КПК HP iPAQ 2410, а обе карманные версии Lingvo и Multitran уместились на флэш-карточке емкостью 256 Мбайт. Дополняя друг друга, эти электронные словари удовлетворяют примерно половину моих терминологических запросов. В остальном приходится руководствоваться глоссариями заказчиков, нормативной документацией и Интернетом. Об использовании онлайновых ресурсов в работе переводчика можно написать не одну статью. Здесь же упомяну о такой форме помощи, как терминологические запросы на переводческих порталах, самый известный из которых — ProZ . Какой же вывод можно сделать? В наши дни переводчик может, не вставая из-за компьютера, эффективно решить практически любую терминологическую задачу.
От MT к TMКак же все-таки обстоят дела с автоматизацией процесса? На какой стадии развития находятся системы автоматизированного перевода, по аналогии с Computer-Assisted Design (CAD) называемые Computer-Assisted Translation (CAT)? Не вдаваясь в лингвистические и технологические тонкости, попытаюсь обрисовать положение дел все с той же утилитарной позиции экономии времени. Первыми на ум приходят технологии машинного перевода, по-английски machine translation. В двух словах, они сводятся к грамматическому анализу, то есть переводу частей речи. Можно подключить словари по тематике оригинала и погадать по результату «перевода», о чем же хотели сказать авторы. Но если нужно не ознакомиться с оригиналом, а опубликовать его перевод, сэкономить время не удастся. «Белковый» переводчик затратит меньше времени на перевод оригинального документа, чем на переделку творения машинного «переводчика», даже если речь идет о больших объемах технической документации с высокой степенью рекуррентности.
Для подобного рода работ в переводческой отрасли прижилась другая технология автоматизации процесса. Правда, прижилась в основном за границей, о чем можно судить даже по разнобою в переводах названия технологии translation memory. Кроме лобовой «переводческой памяти» встречается «накопительный перевод», «автоматизированный перевод» и даже «пул переводов». Подробная статья на эту тему со множеством ссылок есть в Wikipedia
В общих чертах технология сводится к следующим процедурам. Вы загружаете исходный текст в программу переводческой памяти. Программа сегментирует текст, извлекает из своей базы ранее переведенных текстов совпадающие сегменты и выдает частично переведенный текст. Главное отличие от машинного перевода состоит в том, что базу переводческой памяти составляют сегменты из текстов, переведенных человеком. В качестве же сегмента или элемента переводческой памяти чаще всего берется предложение. Отсюда и концепция translation memory, которая основана на том, что предложения в предыдущих переводах можно использовать повторно. Очевидный выигрыш во времени частично нивелируется увеличением затрат на проверку качества перевода. И не только из-за того, что незамеченная ошибка может бесконечно повторяться, но и потому, что переводчик должен передать идею, мысль (словом, message) текста, а не переводить отдельные элементы в виде предложений.
Тем не менее по мере ускорения процессов глобализации спрос на программы переводческой памяти растет. Цены на полные версии многих программ translation memory колеблются от 500 до 2500 долларов и обусловлены не столько технологией, сколько многообразием поддерживаемых форматов переводимой документации. В качестве примеров можно упомянуть STAR Transit и Deja Vu .
Если же перед переводчиком не стоит задача переводить во всех мыслимых форматах, он может выбрать относительно дешевую программу WordFast, которая, в отличие от вышеупомянутых пакетов, не имеет собственной оболочки, а встраивается в Word.
Мало-помалу отношение к этой технологии меняется и в России. Например, компания Promt включила в свою последнюю версию машинного «переводчика» функцию translation memory. Еще одним свидетельством растущего спроса на такого рода программы стало событие, не оставшееся без внимания переводческого сообщества. В июле прошлого года компания SDL объединилась с разработчиком самой популярной программы переводческой памяти Trados. По мере обострения конкурентной борьбы меняется и идеология переводческой деятельности. Все чаще говорят не столько о переводе документации на язык страны назначения, сколько о локализации продукта на десятки языков. Став крупнейшим игроком на рынке средств локализации, компания SDL заговорила уже о стратегии управления глобальными данными (Global Information Management).
Впрочем, тема развития систем переводческой памяти и вообще средств автоматизации переводческого труда достойна не одной статьи в компьютерном журнале и привлечения участников разных сторон этого процесса. Меня же со своей колокольни интересует чисто практический вопрос: где место переводчика в процессе локализации? Начнем с того, что наше занятие еще долго будет оставаться очень трудоемким. В то же время перевод занимает в среднем лишь 40% общих расходов на локализацию, а остальное приходится на долю таких операций, как обработка файлов, форматирование, управление базами данных терминов и переводческой памяти, управление проектом, утверждение готового материала в стране целевого языка. Переводчику на этом конвейере обычно достается файл в формате программы переводческой памяти, где уже учтены предыдущие переводы по этому и подобным проектам и встроена терминологическая база. Некоторые особо продвинутые агентства разделяют работу до конца и не заставляют переводчика овладевать несвойственными ему навыками. В этом случае обработка документа в translation memory выполняется в агентстве, а переводчик получает в файлах Word сегментированный текст, не требующий форматирования и размеченный по степени совпадения с предыдущими переводами, а также глоссарий терминов по данному проекту. Результат работы переводчика снова вставляется в ту же программу для обновления баз данных переводческой памяти и терминологии. Таким образом, круг замыкается, и переводчик возвращается к идеальному варианту работы в текстовом редакторе, имея возможность целиком и полностью сосредоточиться на лингвистических задачах.
Так что я пока не вижу в компьютере серьезного конкурента живому переводчику. Не обойтись им без нас. К сожалению.
ТЕХНОЛОГИИ: Из света в тень
Автор: Максим Стеклов
Нечасто случается, что технология, призванная решить определенные проблемы, не только их не решает, но и усугубляет. Но именно это случилось с технологией изображений с расширенным динамическим диапазоном (HDRI). Изначально предназначенная для повышения реалистичности фотографий и 3D-изображений, HDRI неожиданно стала удобным инструментом для творческого самовыражения и интересной игрушкой для многих любителей фотографии. Фотографы с удовольствием экспериментируют с новой технологией, превращая банальные пейзажи в изображения, напоминающие скорее картины, чем фотоснимки.