Перевод статьи с английского языка выполнен в бюро переводов «Прима Виста». Источник: http://www.wintranslation.com/articles/art05_0008_wordcount.htm
Так как стоимость и срок выполнения перевода основываются на объеме документа, важно получить наиболее точную оценку. Но в настоящее время не существует установленной системы или правил, предписывающих то, какие инструменты следует использовать для подсчета слов, поэтому вам необходимо как минимум представлять себе, как это делается, чтобы понимать, почему не стоит ожидать, что от двух разных бюро вы получите одинаковый подсчет слов.
Как при подсчете слов с помощью функции «Статистика» в MS Word или с использованием такой программы для подсчета слов как PractiCount and Invoice, так и при использовании таких переводческих программ как Trados или Wordfast, сложно получить одинаковые результаты подсчета, ведь все эти инструменты применяют разные способы подсчета. И даже если бюро переводов используют различные системы для подсчета слов в документе, подсчет слов, полученный с использованием программы Trados, не совпадет с подсчетом, полученным из статистики MS Word.
Microsoft Word
Microsoft Word считает словами все, что находится между двумя пробелами. Это означает, что при подсчете слов учитываются числительные и символы. С другой стороны, переводческие программы не включают в подсчет эти знаки, так как предполагается, что в действительности переводить их не требуется. Однако вопрос о том, следует ли учитывать при подсчете числительные и символы, достаточно спорный. Кто-то считает, что раз их не нужно переводить, то и в подсчете их учитывать не следует, тогда как другие не согласны с этим, аргументируя свою точку зрения тем, что переводчику все равно приходится просматривать и проверять каждое числительное и символ, а значит, они должны быть включены в подсчет, особенно, если в документе содержится большой объем подобных данных.
Например, согласно статистике Microsoft Word «1 2 3 @# + 4» – это шесть слов, а по анализу программы Trados - ноль.
Зато MS Word не включает в подсчет текст в текстовых блоках, автоформах, колонтитулах и комментариях.
И если для текстов, где содержится мало текстовых блоков с небольшим количеством текста, это не составит большой проблемы, то для документов, где текстовых блоков много, это серьезно отразится на подсчете слов. У нас бывали случаи, когда мы получали на перевод документы, где из-за специфики проекта весь текст на перевод был представлен в текстовых блоках. Так как это были сравнительно большие документы, неиспользование адекватного способа подсчета слов могло послужить причиной убыточности проекта.
Статистика MS Word также не включает в подсчет текст во внедренных объектах (они еще носят название OLE-объектов; OLE – это технология связывания и внедрения объектов), таких как листы Excel, внедренные в документ Word,или диаграммы с текстом. Так же, как и в случае с текстовыми блоками, в более длинном документе с множеством данных, содержащихся во внедренных листах Excel, более низкие цифры статистики MS Word, могут иметь критическое значение.
В случае HTML-файлов текст, содержащийся в выпадающих меню, в статистику MS Word не включается, особенно это касается файлов со встроенными раскрывающимися списками. Заголовки HTML-страниц, названия кнопок и текст в мета-тэгах статистика MS Word также не учитывает.
Программа PractiCount and Invoice
PractiCount and Invoice – это программа для анализа объема текста, позволяющая осуществлять подсчет строк и знаков в отдельных файлах, папках и папках с вложенными в них подпапками. Программа PractiCount and Invoice подсчитывает объем текста в текстовых блоках, колонтитулах, комментариях и OLE-объектах. Она поддерживает разнообразные форматы файлов, такие как: DOC, RTF, XLS, CSV, PPT, PPS, WPD, PDF, HTM, HTML, SHTML, XML, SGML, ASP, и PHP. Использование программы для анализа объема текста, такой как PractiCount and Invoice, автоматически устраняет некоторые проблемы, которые могут возникнуть при подсчете количества слов в тексте с помощью функции «Статистика» в программе MS Word.
Программы для перевода
Wordfast – это переводческая программа, которая при анализе объема текста учитывает колонтитулы, сноски и примечания. Trados – еще одна переводческая программа – идет дальше и включает в подсчет еще и несвязанные текстовые поля, чего не делает Wordfast. Эти программы не включают в подсчет связанные поля и внедренные объекты.
Кроме того, отдельного внимания заслуживают тэги. Статистика MS Word считает каждый тэг как слово, из-за чего подсчет слов будет неточным, в то время как Trados при анализе объема текста игнорирует все тэги. Программа Wordfast считает каждую группу внутренних тэгов за одно слово, что иногда правильно, так как переводчику приходится работать с тэгами. Преимущество использования переводческой программы для подсчета слов состоит в том, что она позволяет посчитать и количество повторов в документе, благодаря чему можно соответственно снизить тариф на перевод.
В среднем, статистика MS Word показывает меньше слов в файле, чем Trados и Wordfast. Подсчет с помощью программ Wordfast и PractiCount показывает большее количество слов.
Бюро переводов осуществляют анализ объема текста в зависимости от документа. Если это обычный текст в формате MS Word, то можно воспользоваться функцией подсчета статистики. Для подсчета слов в других, более сложных документах, требующих последующего анализа, могут использоваться как программы для подсчета слов, так и переводческие программы. Так и получается, что при таком разнообразии методов подсчета слов, оценки стоимости перевода, предоставляемые разными бюро, могут содержать разные данные о количестве слов в тексте.
Другие материалы
-
Обзор онлайн-переводчиков. Часть 1 Прогрессивное развитие информационных и компьютерных технологий и непрерывное расширение границ…
Читать далее