Читаем без скачивания Информационные технологии и лингвистика XXI века - Алла Викторовна Гуслякова
Шрифт:
Интервал:
Закладка:
Преимущества от использования такого программного обеспечения поначалу могут быть неочевидны – однако по мере наполнения базы данных результаты автоматической подстановки основ для перевода будут становиться все более точными и регулярными.
Архитектура автоматизированной системы и ее функциональные возможности могут различаться. Средства поиска могут работать как с целыми сегментами, так и с отдельными словами или фразами, позволяя переводчику выполнять терминологический поиск. В систему также включают отдельную программу для работы с глоссарием, содержащим утвержденные для применения в проекте термины. Некоторые системы работают с программами машинного перевода. Основной рабочий интерфейс либо встраивается непосредственно в имеющийся текстовый процессор, такой как Word, либо представляет собой отдельный редактор. В состав системы обязательно включают фильтры для импорта-экспорта файлов различных форматов. Кроме того, многие системы, если не все, имеют средство для добавления в память перевода сегментов из, как правило, имеющихся у переводчика старых переведенных файлов.
Автоматизированный перевод (Computer-Aided Translation) – это перевод текстов на компьютере с использованием компьютерных технологий. В отличие от машинного перевода в данном случае человек осуществляет весь процесс перевода, а компьютер всего лишь помогает ему произвести готовый текст либо за меньшее время, либо с лучшим качеством.
Идея автоматизированного перевода появилась с момента появления компьютеров. Переводчики всегда выступали против стандартной в те годы концепции машинного перевода, на которую было направлено большинство исследований в области компьютерной лингвистики, но поддерживали использование компьютеров для помощи переводчикам. В 1960-е годы Европейское объединение угля и стали (предшественник современного Евросоюза) стало создавать терминологические базы данных под общим названием Eurodicautom. В Советском Союзе для создания баз такого рода был создан ВИНИТИ (Всероссийский институт научной и технической информации).
В современной форме идея автоматизированного перевода была развита в 1980 году в статье Мартина Кея[9], который выдвинул следующий тезис: «by taking over what is mechanical and routine, it (computer) frees human beings for what is essentially human» (компьютер берет на себя рутинные операции и освобождает человека для операций, требующих человеческого мышления).
В настоящее время наиболее распространенными способами использования компьютеров при письменном переводе является работа со словарями и глоссариями, с системой памяти переводов (translation memory), содержащей примеры ранее переведенных текстов, а также использование так называемых корпусов, больших коллекций текстов на одном или нескольких языках, что дает сжатое описание того, как слова и выражения реально используются в языке в целом или в конкретной предметной области.
Для локализации программного обеспечения часто применяются специализированные средства, например, SDL Passolo 2015, которые позволяют переводить меню и сообщения в программных ресурсах и непосредственно в откомпилированных программах, а также тестировать корректность локализации. Для перевода аудиовизуальных материалов (главным образом фильмов) также используются специализированные средства, например, Aegisub[10], которые объединяют в себе некоторые аспекты памяти переводов, но дополнительно обеспечивают возможность появления субтитров по времени, их форматирования на экране, следования видеостандартам и т. п.
При синхронном переводе использование средств автоматизированного перевода по необходимости ограничено. Одним из примеров является использование словарей, загружаемых на карманный персональный компьютер (КПК). Другим примеров может служить полуавтоматическое извлечение списков терминов при подготовке к синхронному переводу в узкой предметной области.
В узких предметных областях при большом количестве исходных текстов и устоявшейся терминологии переводчики могут использовать и машинный перевод, который может обеспечить хорошее качество перевода терминологии и устойчивых выражений в узкой области. Переводчик в этом случае осуществляет пост-редактирование полученного текста. Более половины текстов внутри Еврокомиссии (главным образом юридические тесты и текущая корреспонденция) переводится с использованием машинного перевода.
Память переводов, или накопитель переводов (translation memory) – это база данных, содержащая набор ранее переведенных текстов. Одна запись в такой базе данных соответствует «единице перевода» (translation unit), за которую обычно принимается одно предложение (реже – часть сложносочинённого предложения, либо абзац). Если очередное предложение исходного текста в точности совпадает с предложением, хранящимся в базе (точное соответствие, или exact match), оно может быть автоматически подставлено в перевод. Новое предложение может также слегка отличаться от хранящегося в базе (неточное соответствие, fuzzy match). Такое предложение может быть также подставлено в перевод, но переводчик будет должен внести необходимые изменения.
Помимо ускорения процесса перевода повторяющихся фрагментов и изменений, внесенных в уже переведенные тексты (например, новых версий программных продуктов или изменений в законодательстве), системы памяти переводов также обеспечивают единообразие перевода терминологии в одинаковых фрагментах, что особенно важно при техническом переводе. С другой стороны, если переводчик регулярно подставляет в свой перевод точные соответствия, извлеченные из баз переводов, без контроля их использования в новом контексте, качество переведенного текста может ухудшиться.
В каждой конкретной системе памяти переводов данные хранятся в своем собственном формате (текстовый формат в Wordfast, база данных Access в Deja Vu), но существует международный стандарт ТМХ (Translation Memory eXchange format), который основан на XML () и который могут порождать практически все системы памяти переводов. Благодаря этому результаты работы переводчиков можно обменивать между приложениями, то есть переводчик, работающий с программой OmegaT может использовать память переводов, созданную в Irados и наоборот.
Большинство систем памяти переводов как минимум поддерживают создание и использование словарей пользователя, создание новых баз данных на основе параллельных текстов[11] (alignment), а также полуавтоматическое извлечение терминологии из оригинальных и параллельных текстов.
На сегодняшний день наиболее популярными программными системами автоматизированного и машинного перевода с использованием памяти переводов являются: Яндекс. Перевод, Deja Vu, OmegaT, SDLX, Trados), STAR Transit NXT, Wordfast (реализована как набор макросов для MS Word), ABBYY Lingvo, Apertium, Ectaco, Google Translate, PROMT, Across.
Основными достоинствами выше перечисленных программ являются следующие.
1. Высокая скорость. В течение нескольких секунд получается перевод многостраничного текста. Это позволяет быстро понять смысл текста, а если система настроена на перевод текстов определенной тематики, требуется минимальная редакторская правка.
2. Низкая стоимость. При обращении к профессиональным переводчикам приходиться платить за каждую страницу переведенного текста, либо нанимать штатного переводчика, которому приходится платить зарплату. В случае с системой автоматизированного перевода платить деньги необходимо только один раз – при покупке программы, что впоследствии окупается в несколько раз.
3. Доступ к услуге. Немаловажный фактор, который многие критики систем автоматизированного перевода не принимают в расчет. Программа-переводчик всегда под рукой, а обращаться в переводческое бюро во многих случаях связано с дополнительными затратами времени и сил.
4. Конфиденциальность. Системе машинного перевода можно доверить любую (даже конфиденциальную) информацию. Программа-переводчик способна хранить в тайне любые тексты, которой ей доверяет переводчик.
5. Универсальность. Любой переводчик всегда имеет специализацию, т. е.