Параллельный корпус научно-технических текстов как инструмент переводчика

Язык труда и переводы:
УДК:
83'33
Дата публикации:
06 декабря 2020, 14:08
Категория:
Современные методы и технологии корпусной лингвистики
Авторы
Авагян Нарэ Артуровна
Московский государственный технический университет имени Н.Э. Баумана
Аннотация:
Статья посвящена исследованию возможностей параллельного корпуса научно-технических текстов при переводе специальной терминологии. Описаны отличительные черты научно-технических текстов, проявляющиеся в их жанровых особенностях. Показано, что корпус параллельных текстов представляет собой эффективный инструмент, обеспечивающий аутентичный и корректный перевод текстов общего и специализированного дискурса с одного языка на другой. Рассмотрены многозначные лексические единицы в научно-технических текстах. Показано, что научно-технические тексты отличаются своей краткостью, сжатостью, однообразностью.
Ключевые слова:
параллельный корпус, научно-технические тексты, многозначность, параллельные тексты, перевод, терминология
Основной текст труда

Колоссальные темпы развития науки и техники стремительно наращивают объем научно-технических текстов, где с одной стороны детальное изучение научно-технического стиля дает широкий набор средств оперирования языком как для лингвистов, филологов, так и для переводчиков;  а с другой стороны порождает необходимость их автоматической обработки [1]. Параллельные двуязычные и многоязычные корпусы текстов в XXI веке активно интегрируются в глобальную сеть для разработки систем автоматического перевода, основанного на статистическом методе, являясь одним из направлений развития корпусной лингвистики – раздела языкознания, занимающегося созданием и использованием текстовых корпусов. Термин «корпусная лингвистика» появился в 60-х годах XX века. Причин для образования новой области лингвистики было несколько: появление первых компьютеров, а вместе с ними и возможности цифровой обработки текстов; необходимость анализа как грамматического, так и лексического состава языка [1].

Параллельные корпуса текстов становятся одним из наиболее интересных и быстро развивающихся направлений лингвистики, чему в немалой степени способствовало интенсивное развитие компьютерных технологий. В соответствии с определением М. Бейкер, параллельный корпус это тексты с переводами на один или более языков, представленные в электронном формате.

Параллельные тексты являются ценным вспомогательным средством при обучении переводу, и, в сущности, ни одно пособие по практике перевода не обходится без корпуса параллельных текстов [2]. Проблема эквивалентности языковых структур в исходном тексте и тексте перевода рассматривается:

а) выработки методик перевода ряда языковых реалий, характерных для научно-технических текстов;

б) создания корректных алгоритмов семантического выравнивания параллельных текстов на уровне значимых компонентов.

Корпуса технических текстов стандартов являются предметом лингвистического исследования. На основе лингвистического исследования технических текстов стандартов выявлены несоответствия перевода модальных глаголов с английского языка на русский язык [3]. 

Технические тексты отличаются своей краткостью, сжатостью, однообразностью. Терминология технических текстов стандартизирована и точна, стиль научно-технических текстов является информативной, содержательной, логичной со строгой последовательностью. Стиль научно-технических текстов является точной и объективность. В научно-технических текстах всегда присутствует четкая связь между основной идей и второстепенной.

Лексические особенности научно-технических текстов является насыщенность узкоспециальными и общенаучными терминами, в связи с их точностью и информативностью [4]. В научно-технических текстах нами была замечена специальная общетехническая лексика – слова и словосочетания, не являющиеся терминами, всевозможные производные от терминов, а также общенародные слова, употребляющиеся в строго определенных сочетаниях и потому являющимися специализированными [5].

Применение различных видов сокращений являются еще одной лексической особенностью научно-технических текстов. Сокращения считаются лексическими единицами научно-технического языка, поскольку могут функционировать самостоятельно и фиксироваться в лексикографических источниках. В научно-технических текстах важную роль играют служебные или функциональные слова, такие как предлоги, союзы, а также наречия.

Грамматики научно-технического текста характеризуется частым употреблением причастных и деепричастных оборотов [6, 7].

Основной формой предложений являются сложноподчиненные и сложносочиненные. Они, в свою очередь, обусловливают широкое употребление составных союзов и предлогов, неличных форм глагола в функции дополнения или обстоятельства и соответствующих инфинитивных и герундиальных оборотов.

Для обозначения временных и постоянных признаков предметов часто употребляются краткие прилагательные. Также характерно широкое использование отвлеченных существительных, особенно среднего рода (явление, свойство и др.), глаголов на «–ся» (программы запускаются автоматически), цепочки из нескольких существительных в родительном падеже.

Ещё одной особенностью является редкость использования формы 2-го лица, а форма 1-го лица единственного числа часто заменяется множественным числом, так называемое “авторское мы” (Таким образом, полученные нами данные говорят о… ). Кроме того, следует выделить распространенность номинативных рамочных конструкций с таким порядком слов, при котором группа слов, поясняющая причастие или прилагательное, выступает вместе с ним в роли препозитивного определения (выделяемые в процессе ядерного распада частицы и т. п.) [8].

Морфологические особенности составляют сочетания с существительными в винительном падеже (скорость (в) 60 км/ч) для выражения определительных отношений, а также преобладают беспредложные конструкции (размером 3 Гб) [9, 10].

Что касается прилагательных, то качественные реже представлены, чем относительные (шпионская программа), а полные формы прилагательных преобладают над краткими. Широко распространена форма положительной степени прилагательных, в основном со словами более, менее.

Превалируют глаголы в форме настоящего времени несовершенного вида. Ими передается чаще всего атрибутивное, вневременное значение, которое выражает длительность, постоянность действия или значение констатации факта. Кроме того, некоторые глаголы употребляются только в одной видовой форме, другие вообще не имеют парного глагола совершенного вида.

В научно-технических текстах встречается много перечислений, состоящих из законченных и незаконченных фраз. Незаконченные фразы пишутся со строчных букв и обозначаются арабскими цифрами или строчными буквами с полукруглой закрывающей скобкой.

К синтаксическим особенностям научно-технических текстов можно отнести развернутую систему связующих элементов (союзов, союзных слов), синтаксическую полноту оформления высказывания, частое употребление клишированных структур, наличие аналитических конструкций, преимущественно именной характер морфологических компонентов предложения и т. д. [11].

Не менее характерна нагруженность придаточными предложениями, причастными и деепричастными оборотами. Обилие параллельных конструкций и вводных слов обусловлено необходимостью аргументировать высказываемое.

Важной характеристикой научно-технического стиля является его стремление к лаконичности, краткости и компактности изложения, что приводит к синтаксической компрессии — сокращению избыточности при сохранении объема информации, например, для английской научно-технической литературы свойственно широкое использование эллиптических конструкций, для русского языка — бесподлежащных односоставных предложений; не менее важной характеристикой является наличие большого числа предложений с однородными членами, распространенность причастных, предложно-падежных, инфинитивных и других оборотов [12]. Что касается простых предложений, то, кроме ритмообразующей роли, они также служат для введения новой мысли, находясь в начале абзаца, а помещенные в конце — подытоживают рассуждение.

В технических текстах часто встречаются многозначные слова. Одной из главных переводческих проблем при переводе научно-технической терминологии является полисемия и омонимия. Под полисемией понимается способность слова иметь одновременно несколько значений. Явление полисемии, или многозначности, относится к числу важнейших проблем семасиологии и постоянно находится в центре внимания лингвистов. Под омонимии понимается слова одинаковые по написанию и звучанию, но разные по значению слова и другие единицы языка. Полисемия основана на связанности значений слова, их семантическом «родстве», а омонимия — на их разрыве, невыводимое одного из другого. В толковом словаре русских научно-технических терминов были проанализированы большое количество многозначных слов. Например, термин «модуль» в технических текстах встречается в двух разделах:

1) в физике — модуль Юнга (англ. Young's modulus, elastic modulus в терминологическом словаре «Металлы»);

2) в математике:

а) модуль Вектора (англ. absolute value of a vector, vector magnitude, scalar of vector, magnitude of vector magnitude);

б) модуль комплексного числа (англ. complex number modulus, modulus of complex number, absolute value of complex number);

в) модуль непрерывности (англ. modulus of continuity);

г) модуль перехода (transition module).

Эффективным средством исследования явлений полисемии и омонимии терминологических единиц является параллельный корпус научно-технических текстов. В нем наглядно можно отслеживать способы перевода того или иного термина средствами другого языка, а также проследить употребление терминов в рамках узкой предметной области или в целом в науке и технике. Подбор правильного переводного эквивалента многозначного слова или сокращения из словаря традиционно является сложным процессом, требующим от переводчика изучения дополнительных материалов по теме. При этом не всегда переводимый термин можно легко найти в дополнительной литературе. В таких случаях целесообразно прибегнуть к параллельному корпусу научно-технических средств, где поисковая выдача на запрос переводимого термина будет содержать и сам термин, и способы его перевода в некотором контексте. Более того, пользователь может сам ограничить предметную область для поиска или же выбрать определенные тексты, где по его мнению содержится искомая информация.

Литература
  1. Бутенко Ю.И. Метод разрешения лексической многозначности поискового запроса на основе онтологий /Ю. И. Бутенко // Прикладная информатика, 2020. Т. 15, № 5. С. 103–110. DOI: 10.37791/2687-0649-2020-15-5-103-110
  2. Бутенко Ю.И., Маргарян Т.Д., Кочеткова Е.Л. Переводческая деятельность в условиях цифровизации: обучение и трудоустройство // Alma mater (Вестник высшей школы). 2020. № 9. С. 98–103. DOI: 20339/AM.09-20.09810
  3. Бутенко Ю.И. Модель текста стандарта при информационном поиске в коллекции документов нормативной базы // Вестник компьютерных и информационных технологий. 2020. Т. 17, № 11. С. 23–32. DOI: 10.14489/vkit. 2020.11.pp.023-032
  4. Беляева Л.Н. Словари систем машинного перевода и параллельные корпуса текстов // Компьютерная лингвистика и интеллектуальные технологии. М.: Изд-во РГГУ, 2004. С. 54–62.
  5. Беляева Л.Н. Параллельный корпус текстов в задачах лексикографического анализа // Компьютерная лингвистика и интеллектуальные технологии. М.: Изд-во РГГУ, 2013. С. 12–15.
  6. Рыжкова А.Г. Функциональные и типологические характеристики перфекта в научно-техническом тексте (на материале параллельных переводов). Воронеж.: Изд-во ВГУ, 2011. С. 233–237.
  7. Зубов А.В. Использование параллельного корпуса текстов для перевода несвободных словосочетаний. М.: Изд-во МГОУ, 2011. С. 26–37.
  8. Беляева Л.Н. Исследование параллельных корпусов в процессе создания и ведения переводных словарей. Пермь.: Пермский национальный исследовательский политехнический университет, 2013. С. 82–91.
  9. Сичинава Д.В. Параллельные тексты в составе национального корпуса русского языка: новые направления развития и результаты. М.: Институт русского языка имени В.В. Виноградова РАН, 2015. С. 27–40.
  10. Молодкин А.М. Использование корпусных технологий в исследовании переводных параллельных текстов. Саратов: Издат. дом «МарК», 2016. С. 45–63.
  11. Садыков А.Р., Недава С.А., Саляхова Г.И. Электронные параллельные корпуса текстов. Казань: Казанский (Приволжский) федеральный университет, 2017. С. 11–30.
  12. Бутенко Ю.И., Семенова Е.Л. Влияние лингвистических особенностей текстов стандартов на информационный поиск // Филологические науки. Научные доклады высшей школы. 2019. № 6. С. 29–35. DOI: 10.20339/PhS.6-19.029
Ваш браузер устарел и не обеспечивает полноценную и безопасную работу с сайтом.
Установите актуальную версию вашего браузера или одну из современных альтернатив.