Читаем без скачивания Новые соединения. Цифровые космополиты в коммуникативную эпоху - Этан Цукерман
Шрифт:
Интервал:
Закладка:
Удивляющую многих готовность переводчиков Yeeyan работать над проектом без финансового вознаграждения исчерпывающе объясняют специалисты, изучающие программное обеспечение с открытым исходным кодом и «Википедию». Обладающие большим опытом переводчики еще могут заработать себе на жизнь переводами в интернете, но куда больше тех, кто зарабатывает несколько центов, время от времени получая заказы через сетевые биржи труда, подобные запущенному компанией Amazon порталу Mechanical Turk. Для переводчиков Yeeyan, это скорее любимое хобби, нежели работа. Чжан говорит, что проявился и ряд других мотивирующих факторов. Переводчикам нужен опыт, который они могли бы применить уже на хорошо оплачиваемых работах. Кроме того, признание со стороны профессионального сообщества, чувство удовлетворения от профессионального роста и удовольствие от материала – все это хорошая мотивация. То есть в совместных переводческих проектах действует та же мотивация, что позволяет существовать и развиваться таким общественным инициативам, как программное обеспечение с открытым исходным кодом и «Википедия». Это культура дара, в которой чем лучше дар, чем полезнее перевод, тем выше статус. То есть положение утверждается актами дарения. В своем основополагающем труде «Сетевое богатство» Йохай Бенклер обозначил это явление как «состязательное дарение – то есть дарение, цель которого – показать, что человек, дающий больше, обладает более высоким статусом, нежели тот, кто дал меньше».[194]
Многие сообщества, добившиеся успехов на поприще онлайн-переводов, используют схожие модели. Аудитория конференций TED – Technology, Education, Design, – попасть на которые раньше можно было только по приглашению, значительно расширилась, выйдя за пределы тех нескольких тысяч энтузиастов, что предпочитают посещать их лично в Монтерее, штат Калифорния, когда в 2006 году медиапродюсер TED Джун Коэн начала публиковать видео лекций в интернете.[195] Спустя три года после размещения первого видео, Джун осознала, что лекции были бы интересны еще большей аудитории, если бы слушатели могли смотреть их с субтитрами на родном языке. Тогда она наняла фирму, делающую высококачественную стенограмму англоязычных лекций, и профессиональных переводчиков для создания субтитров на тагальском или турецком языках.
Вдохновившись в том числе успехом нашего ресурса Global Voices, который использовал добровольцев для перевода интернет-контента, Джун решила провести эксперимент: для перевода одних текстов она пригласила волонтеров, другие заказала профессиональным переводчикам, чтобы установить высокую планку качества. «Выяснилось, что качество переводов, сделанных волонтерами, ничуть не хуже, а то и лучше тех, что сделаны за деньги», – говорит Джун. «Мы были поражены». Переводчики TED не получают денежной компенсации за свою работу, однако их деятельность высоко оценивается сообществом, на сайте их имена стоят рядом с именами самих лекторов, а самых плодовитых и успешных переводчиков приглашают на конференции лично. Джун считает, что успех переводческого проекта имеет две основные причины: признание сообществом важности этой работы, и то обстоятельство, что переводчики сами могут выбрать материал для работы. «Перевод доклада, который вам интересен, – почти развлечение, скучный перевод – работа». Получается, что модель перевода на общественных началах лучше всего работает, когда цель – это работа над самым захватывающим материалом, а не перевод всего объема текстов.
Объемы волонтерского перевода уже весьма внушительны. Более чем часовую лекцию Альберта Гора о глобальном потеплении 2008 года перевели на 36 языков, а запись посмотрело 1,5 млн зрителей. За два года проекта переводчики TED сделали 18 000 переводов на 81 язык. В среднем лекция переводится на 24 языка в течение нескольких недель. Неанглийскими субтитрами пользуется лишь около 10 % зрителей TED.com, тем не менее это больше миллиона зрителей в месяц. Более того TED сотрудничает с Youku, китайским конкурентом YouTube, чтобы с китайскими субтитрами лекции TED могли посмотреть еще миллионы зрителей.
Добровольческие программы перевода – орудие мощное, но не быстрое. С их помощью говорящие на арабском смогут понять англоязычную лекцию, но им приходится ждать по несколько дней, а то и недель, пока арабский переводчик выполнит свою задачу. Кроме того, даже просмотрев лекцию с переводом, они не успевают участвовать в онлайн-дискуссиях, которые разворачиваются вскоре после размещения новых лекций на сайте. По-настоящему нам нужны переводы, которые, были бы такими же точными и передающими все оттенки, как те, что делают волонтеры TED или Global Voices, и производились бы так же быстро, как в Google-переводчике.
Проект Эда Байса Meedan.net – это онлайн-пространство, где арабские и англоязычные пользователи собираются в общей языковой среде, создаваемой как с помощью машинного, так и традиционного перевода. Слово «Meedan» по-арабски означает «городская площадь», и авторы проекта пытаются создать сетевое общественное пространство, где люди могли бы беседовать между собой на английском и арабском языках. Размещенные на сайте новостные материалы из онлайн-источников автоматически переводятся с арабского на английский и наоборот с помощью машинного перевода. Комментарии к новости можно писать на обоих языках, поскольку после отправки они также переводятся автоматически. При этом машинный перевод в сообществе Meedan считают лишь первым шагом; добровольцы просматривают новости и комментарии и «подчищают», а когда нужно, полностью переделывают уже опубликованный машинный перевод. Машинный перевод позволяет носителям разных языков поддерживать разговор в режиме реального времени. Традиционный перевод делает разговор более понятным, кроме того, создается постоянная запись беседы, которую впредь можно использовать как онлайн-ресурс.
Замысел Байса расширить арабо-англоязычный диалог с помощью перевода весьма амбициозен, однако и он бледнеет на фоне планов Луиса фон Ана, создателя платформы Duolingo. Фон Ан является профессором Университета Карнеги—Меллон иэкспертом в новой области «коллективно-распределенного мышления». Распределенное мышление использует навыки тысяч людей, работающих параллельно над решением проблем, непосильных компьютерам. Наибольшую известность фон Ан приобрел благодаря внедрению формы reCAPTCHA, которую вам, вероятнее всего, приходилось заполнять, чтобы оставить комментарий на веб-сайтах. Для заполнения формы вам нужно расшифровать два слова и таким образом продемонстрировать, что вы человек, а не компьютерная программа. В процессе вы помогаете расшифровывать сканы книг, каждый раз распознавая одно слово. В 2008 году объем текстов, расшифрованных с помощью reCAPTCHA, равнялся примерно 160 книгам в день,[196] а сейчас используется для исправления ошибок в Google Books – крупнейшем проекте Google по сканированию основных университетских библиотек.
Если люди могут расшифровать нечетко отсканированные слова и транскрибировать книги, почему нельзя использовать этот ресурс для перевода документов? Фон Ан поставил перед своим аспирантом Северином Хакером вопрос: «Как нам привлечь 100 миллионов человек к переводу веб-страниц на все ведущие языки, да еще и бесплатно?»[197] Так они придумали проект, который помогает миллионам людей в изучении второго языка. Зарегистрируйтесь на Duolingo, и вам предложат учить испанский, французский или немецкий. Сначала вы будете переводить простые, шаблонные предложения, но по мере повышения вашего языкового уровня вам начнут давать на перевод предложения с действующих веб-страниц.
Можно ли доверить человеку, только начавшему изучать испанский язык, переводить веб-страницы? Придуманные фон Аном алгоритмы помогают объединить варианты десятков неопытных переводчиков в результат, который, как он утверждает, не уступает по качеству работе профессионального переводчика. Его преимущество в масштабе: ежедневно 30 миллионов пользователей помогают решать поставленные перед reCAPTCHA задачи. Фон Ан убежден, что, даже если небольшой процент этих пользователей решит выучить новый язык, он сможет перевести все материалы английской «Википедии» на испанский менее чем за неделю.[198]
Что значит цифровое вымирание?
В то время как Yeeyan и TED доказывают, что добровольцы могут производить высококачественный перевод газетных статей и научных лекций, а Meedan предлагает сочетание машинного и традиционного перевода для общения в реальном времени на разных языках, по-настоящему впечатляющих результатов можно добиться, лишь совместив эти методы. Для качественного машинного перевода программистам необходим большой корпус переведенного между двумя языками материала. Если объем текста, переведенного на платформах Global Voices или TED, на сегодня составляет лишь небольшую часть корпуса, необходимого для построения системы статистического машинного перевода, сотрудничество между переводческим сообществом и специалистами по машинному переводу может привести к созданию таких корпусов там, где другие варианты отсутствуют. Четыре тысячи произведенных силами Global Voices малагасийских переводов общим объемом в 300 тысяч слов составляют всего лишь 1,2 % от размера корпуса текстов Европарламента (один из основных источников параллельных корпусов текстов, состоящий из разнообразных документов парламентского делопроизводства),[199] и, вероятно, это слишком мало для создания точной системы машинного перевода. С другой стороны, это, пожалуй, самый большой из существующих корпусов переводных текстов с английского на малагасийский и обратно.