В НОМЕРЕ

“Терминологический менеджмент

Основные принципы и инструментарий управления терминологией для технического переводчика”



Мария Ладушина, руководитель направления лексикографии Компании ЭГО Транслейтинг, лингвист, эксперт по терминологическому менеджменту и работе с переводческими данными.


Задачи перевода нефтегазовые компании решают разными путями: многие имеют собственные отделы переводов, другие работают с поставщиками лингвистических услуг. Во всех случаях одним из самых важных аспектов работы технического переводчика остается терминология, ведь именно от нее в наибольшей степени зависит качество отраслевого перевода.

Компания ЭГО Транслейтинг много лет работает с заказчиками из нефтегазовой отрасли, которая исторически является для нее ключевой. В этой статье хотелось бы осветить проблему важности применения терминологии на отраслевых переводческих проектах и раскрыть необходимые шаги для выстраивания системы терминологического менеджмента.

Налаженная работа с терминологией — это тот фактор, который позволяет не только повысить качество перевода в целом, но и системно управлять им. Однако для этого нужно приложить усилия по созданию и поддержке словарей, корректному ведению баз переводов и, главное, по внедрению текущего контроля единства терминологии на переводческих проектах. Не все компании в равной степени готовы к переходу на эти процессы, ведь зачастую это требует как затрат, так и пересмотра текущей цепочки обработки заказов.

Однако нельзя недооценивать важность такой работы. Для сложных технических проектов терминологическая ошибка может оказаться критичной и повлечь за собой серьезные финансовые риски вплоть до аварий на производстве. Точность и единообразие терминов в инструкциях к оборудованию гарантирует, что они будут понятны для пользователя. Продуманная терминология в маркетинговых материалах обеспечивает высокий уровень клиентских коммуникаций и повышает лояльность потребителей товаров и услуг. Не говоря уже о случаях юридического перевода, когда неверный термин в контракте может поставить под сомнение миллионные сделки.

Итак, в мире текстовых коммуникаций нельзя пренебрегать терминологической стороной перевода. К счастью, в реалиях сегодняшнего дня на смену бумажным словарям пришли разнообразные средства автоматизации. Многие еще помнят времена, когда переводчик с узкой специализацией ценился на вес золота — в первую очередь благодаря наработанному за годы знанию отраслевой терминологии. Условно говоря, такой специалист имел словарь необходимых терминов «в голове». И если на устных проектах это по-прежнему актуально, то в письменном переводе электронные средства работы с терминами (словари, CAT-системы, программы контроля) позволяют привлекать, порой срочно, разных переводчиков, быстро обучать новых специалистов, обеспечить преемственность переводческой информации на проекте.

В этом состоят два главных преимущества терминологического менеджмента (налаженной системы управления терминологией) для переводческих подразделений:

1. При невозможности привлечь отраслевого переводчика наличие качественного глоссария может спасти положение: пользоваться правильно составленным словарём сможет и переводчик без специализации в нефтегазовой отрасли. В противном случае исправить положение мог бы только дорогостоящий редактор. В такой ситуации соблюдение словаря позволяет снизить расходы на перевод.

2. То же касается срочных проектов, распределенных на нескольких переводчиков. Иногда глоссарий — единственный способ соблюсти единообразие в переводах от нескольких исполнителей, особенно в условиях цейтнота и одновременной работы. Здесь наличие словаря — это важное средство оптимизации сроков проекта.

“МАШИНА ЗАМЕНИТ ПЕРЕВОДЧИКА ТОЛЬКО ТОГДА, КОГДА ЛЮДИ НАУЧАТСЯ ЧИТАТЬ МЫСЛИ ДРУГ ДРУГА”

«Уровни» работы отдела переводов.

Степень технологической и процессной «зрелости» переводческих подразделений условно можно разделить на три ступени:

Базовый уровень (без технологий).

На этом этапе есть только переводчик и, возможно, редактор, а из технологий только программа работы с текстом, например, Microsoft Word. В принципе, этот «набор» минимально достаточен для редких разовых переводов, и еще в недавнем прошлом, до появления CAT-инструментов, отделы переводов работали именно так. Однако в современном мире такой путь неэффективен для регулярных проектов, так как не опирается на решения, позволяющие соблюдать единообразие переводов и обращаться к накопленным материалам.

Средний уровень (переводчики + CAT-система).

На этом уровне все работы ведутся в CAT-инструменте (например, SDL Trados, Memsource, MemoQ и другие). CAT-система (Computer Assisted Translation) базируется на технологии Translation Memory, которая позволяет хранить и использовать все ранее выполненные переводы, что ускоряет работу и повышает единообразие текстов перевода.

Продвинутый уровень (CAT+ налаженная работа с терминологией).

На этом этапе к регулярному использованию CAT-инструментов добавляется компетентное ведение и поддержка терминологических баз. И если CAT-системы уже прочно утвердились как стандарт работы переводческих подразделений, то на уровень системной работы с терминологией перешли еще не все отделы переводов отраслевых предприятий. Однако многие уже сейчас осознают важность этих процессов и прилагают усилия для их оптимизации.




Понятно, что переход на каждый следующий уровень требует серьезной подготовительной работы, которую Компания ЭГО Транслейтинг и ее технологическое подразделение EGOTECH помогает провести своим клиентам посредством различных консалтинговых услуг в области терминологии, управления качеством перевода, работы с переводческими базами данных и машинного перевода.

Рассмотрим, как выстроить эти процессы, а также какой инструментарий терминологического менеджмента для этого нужен – от самых простых до сложных высокотехнологичных инструментов.

Где хранятся термины

Как правило, термины хранятся и обрабатываются в словарях (глоссариях, терминологических базах) внутри CAT-системы. Терминологическая база может составляться как на одном, так и на нескольких языках. Компании, разрабатывающие техническую документацию как часть своих продуктов, ведут и поддерживают специализированные многоязычные словари и обязательно используют их при составлении мануалов, переводе чертежей и т. п

Таким образом, именно словарь (глоссарий) в CAT-программе – это основа работы с терминологией. От применяемой системы зависит формат файлов словарей, интерфейс работы с ними, а также правила занесения терминов. Однако, все CAT-инструменты имеют похожий принцип использования словаря в текущей работе: обращение к глоссарию происходит автоматически прямо в окне перевода. Некоторые CAT-средства также позволяют заносить термины в словарь нажатием комбинации клавиш непосредственно при работе. Можно было бы сказать, что функционала CAT-систем достаточно для базовых процессов управления терминологией, однако и здесь есть некоторые «подводные камни».

Корректная работа со словарем.

Для правильной работы с базой терминов нужно понимать основные принципы использования терминологии и ее проверки. Зачастую в словарь вносятся термины, которые могут иметь различные варианты перевода и, в зависимости от контекста, не переводятся словом из словаря (например, «connection» - «фитинг», «testing» - «гидродинамические исследования скважин», «exchange» - «биржа» — во всех этих случаях перевод терминов может сильно отличаться в зависимости от окружения. На этапе проверки терминологии это приводит к тому, что возникает много «ложных срабатываний»: система автоматического контроля не находит нужный термин в переводе и выдаёт ошибку. В результате лингвист (переводчик, редактор, лексикограф), просматривающий ошибки, тратит больше времени на проект. Избежать таких нерелевантных ошибок помогает знание основного принципа вычленения терминологии: в словарь должны попадать главным образом узкоспециальные, однозначные термины, не зависящие от контекста. Контекстуальные переводы должны храниться только в ТМ. Чтобы соблюсти это требование, лучше создавать много небольших глоссариев под каждый конкретный проект и задачу, а не смешивать все термины в одну большую терминологическую базу.

“ОДНИМ ИЗ САМЫХ ВАЖНЫХ АСПЕКТОВ РАБОТЫ ТЕХНИЧЕСКОГО ПЕРЕВОДЧИКА ОСТАЕТСЯ ТЕРМИНОЛОГИЯ, ВЕДЬ ИМЕННО ОТ НЕЕ ЗАВИСИТ КАЧЕСТВО ОТРАСЛЕВОГО ПЕРЕВОДА”

Другое важное условие – своевременная поддержка и обновление словарей: удаление неактуальных терминов, добавление новых, внесение правок. За этим должен следить переводчик или выделенный специалист-лексикограф. Кроме того, владелец процесса в переводческом подразделении должен своевременно инициировать создание словаря – в идеальном случае, еще до запуска документов в перевод.

Создание словарей: вычленение терминов

Во многих компаниях, где отдел переводов еще не перешел на систематическую поддержку терминологии, тем не менее, накоплен большой объем двуязычных материалов. Для таких подразделений первым этапом должно стать составление словарей – вычленение терминологии из существующих документов и их переводов.

Понятно, что наиболее полно и точно с этой работой справится не компьютер, а человек – переводчик, работающий на проекте, или сторонний лингвист, понимающий принципы работы с терминами. Однако существуют программы, которые позволяют частично автоматизировать эту работу. Эту группу решений для вычленения терминологии еще называют «экстракторами» терминов. В основе таких инструментов — сложные программные алгоритмы, основанные на частотности употребления слов в тексте, с обширным списком исключений. Без этой сложной «начинки» программы извлекали бы из текстов либо наиболее часто встречающиеся слова (например, местоимения, предлоги и т. п.), либо все имена существительные, и такой список не имел бы ничего общего с узкоспециальным словарем.

На рынке профессионального переводческого ПО существуют несколько популярных программ для вычленения терминологии, и все они работают по-разному. Проанализировав существующие инструменты, мы увидели, что, к сожалению, большинство из них не очень хорошо работают с русским языком, специфичным в плане грамматики и синтаксиса. Поэтому в Компании ЭГО Транслейтинг разработан и продолжает совершенствоваться собственный инструмент вычленения терминологии. Особое внимание в данном программном решении уделено нахождению составных терминов – словосочетаний из двух и трех слов.

Тренд последнего времени и амбициозная задача, которую ставят перед собой разработчики подобных инструментов — это вычленение терминологии одновременно из оригинала и перевода, то есть получение словаря сразу на двух языках. Это решение пока не найдено, так как напрямую связано со сложностями обработки естественного языка и машинного обучения. Для корректной работы двуязычного экстрактора терминов нужно «объяснить» программе, что именно данное слово в переводе соответствует конкретному слову оригинала, и на сегодняшний день эта задача не решена.

“ДЛЯ СЛОЖНЫХ ТЕХНИЧЕСКИХ ПРОЕКТОВ ТЕРМИНОЛОГИЧЕСКАЯ ОШИБКА МОЖЕТ ОКАЗАТЬСЯ КРИТИЧНОЙ И ПОВЛЕЧЬ ЗА СОБОЙ СЕРЬЕЗНЫЕ ФИНАНСОВЫЕ РИСКИ”


Контроль терминологического единства

Итак, актуальный словарь в CAT-системе обеспечивает переводчика базой терминов для использования в работе. При этом возможно, что глоссарий по тем или иным причинам не соблюдался, и в этом случае крайне важно иметь средство контроля. Понятно, что проверить терминологию в переводе может и редактор, вычитывающий перевод. Однако на больших объемах и при сжатых сроках это далеко не всегда возможно, и здесь на помощь приходят автоматизированные инструменты проверки терминологии.

Всем, кто системно ведет переводческие проекты, знакомо понятие consistency. В переводе под ним понимается единообразие, преемственность — будь то в терминологии, фразовых решениях или в переводе целых фрагментов текста. Такое единообразие на уровне абзацев и предложений позволяет обеспечить CAT-система благодаря технологии translation memory и, в особенности, встроенным средствам проверки качества. Аналогичные инструменты QA существуют и для проверки единства терминологии – как внутри CAT-систем, так и в виде самостоятельных программных решений, а также как часть комплексных QA инструментов.

С программной точки зрения, одно из базовых требований к инструменту проверки терминологии – умение «понимать», как изменяется грамматическая форма слова. В программах старого поколения, а также в некоторых существующих, изменение падежа термина может привести к ложному срабатыванию в процессе проверки. Это особенно актуально для высокофлективного русского языка. Поэтому для регулярной проверки терминологии в Компании ЭГО Транслейтинг также используется собственная разработка — решение EGOTECH QA Term (egotech.tech). Этот инструмент специально настроен на корректную работу с русским языком и позволяет проводить проверку в веб-интерфейсе в отдельной среде, не зависящей от CAT-систем.

Какой бы инструмент терминологического контроля ни был выбран, главный принцип работы с терминологическим QA – регулярность. Только контроль терминологии после каждого перевода позволит заносить в ТМ исключительно корректные варианты, а значит, избежать ее «загрязнения».

Итак, для внедрения и системного ведения терминологического менеджмента в отделе переводов необходимо:

  • при необходимости создать словари из текущих материалов: силами лингвистов или в полуавтоматическом режиме с привлечением специальных программ;
  • систематизировать работу со словарями в CAT-программе;
  • наладить текущий контроль терминологии, подобрав оптимальный инструмент терминологического QA.

Существует также альтернативный путь — настроить и «кастомизировать» систему машинного перевода, обученную на ваших материалах, в первую очередь, накопленных ТМ. Это значительно повысит скорость работы, а натренированный «движок» будет выдавать результат, максимально близкий к вашим реальным переводам. Но и для этих целей необходимы «чистые» базы переводов, не содержащие ошибок – а значит, для перехода на новый уровень автоматизации отлаженная система терминологического менеджмента становится необходимым условием.