О проблеме перевода текстов с русского на иностранные языки.

Кон В. Г.   11-01-2025   http://kohnvict.narod.ru

Проблема перевода текстов с русского на иностранные языки существовала, наверно, с момента появления русского языка. Но в современном виде, она оказалась второй по нужности задачей для компьютера после вычислений. И какие-то программы делались постоянно. Однако существенный скачок успеха возник после создания программ искусственного интеллекта. И тоже не сразу. Понадобилось какое-то время, чтобы довести операцию перевода до такого качества, которое вполне приемлемо для использования без всякой правки. И, более того, даже для людей со средним знанием двух языков сейчас вполне разумно пользоваться интернет переводчиком, так как у него запас слов может быть больше.

Что еще важно, компьютерный перевод не требует печатать переведенный текст. Даже при 100-процентном знании языка текст все равно придется печатать, а компьютер сам печатает, и это очень сильно сокращает время работы над переводом. До сих пор самым лучшим переводчиком является сайт от компании Гугл, далее Гугл Переводчик (ГуПе). Сайт ГуПе устроен таким образом, что там есть два окна, причем в левый копируется исходный текст, устанавливаются языки и в правом появляется перевод. Затем его надо копировать в ваш документ и дело сделано. Процедура копирования стандартная, с помощью клавиш [Ctrl] и [C], [V]. Такую процедуру еще называют (копипаст). Нельзя сказать, что она очень удобная, но главная неприятность в том, что есть ограничение на размер текста, не более 500 символов. То есть очень большие тексты надо переводить по частям.

Но большинство пользователей компьютера вообще не знают, что такое голый текст. Ведь люди знают только то, чему их учат. А учат их пользоваться программами от фирмы Майкрософт. Почему так? Сложно ответить. Но есть какая-то традиция делать в России все то же самое, что и в Америке. В свое время были стиляги, танцевали рок, твист, потом продолжали перенимать все американское и вот докатились до программ от Майкрософт. Текст в программе Ворд -- это уже документ, или по научному (форматированный текст). Кроме doc и docx файлов, существуют также pdf файлы и файлы интернета, которые часто называют сайтами. На сайте ГуПе есть 4 кнопки (текст) (изображения) (документы) (сайты). Выше я говорил о том, как работает кнопка (текст). Она возникает по умолчанию. Кнопка (изображения) переводит тексты на картинках. Это тоже бывает необходимо. Бывают картинки, на которых много текста. Но все же это бывает необходимо не часто и не так интересно.

Третья кнопка (документы) более интересна. Вот она как раз переводит, в частности, docx и pdf форматы. То есть не меняя форматирование она переводит тексты. При этом документ как бы сразу превращается снова в документ, но на другом языке. Однако с форматированием дела обстоят таким образом, что ошибки иногда случаются и получается не совсем так, как было в исходном документе. Все-таки документы бывают разной степени сложности. Простые документы, однако, получаются неплохо. Если все же есть ошибки, то docx формат более удобен, потому что его можно редактировать, а для редактирования pdf файлов хороших бесплатных программ нет. Майкрософт Офис тоже не бесплатный, но он как бы у всех есть. А большинство пользователей компьютера pdf файлы просто читают.

Последняя кнопка (сайты) позволяет переводить сайты по указанному адресу в интернете. И тут снова проблемы. Если документ сайт ГуПе берет с компьютера пользователя, то сайт должен быть в интернете. Но сайты в интернете есть не у всех. Кроме того, как показала практика, ГуПе отказывается переводить сайты с джаваскрипт кодом, а без него сайты уже почти никто не делает. То есть эта кнопка снова не очень то практически полезная. Ниже я расскажу как все-таки можно существенно увеличить возможности перевода, особенно при использовании моей программы номер 74.

Для тех, кто не в курсе, объясняю, что у меня есть программа -- интерпретатор собственного языка программирования AdCoL. Cкачать и установить программу на своем компьютере достаточно просто и бесплатно. Как это сделать написано на моем сайте о программе. Чтобы использовать программу в полной мере надо учить AdCoL. Это открывает неограниченные возможности для творчества. Но если нет желания или времени, то можно использовать готовые программы, которые я написал сам на этом языке. Они вызываются просто но номеру. И вот я как раз хочу рассказать о программе номер 74. Но сначала общий рецепт для тех, кто делает форматированные тексты. Например, сайты интернета пишутся на языке форматирования html и на языке программирования javascript. Браузер понимает и исполняет оба эти языка.

Что можно сделать, если ГуПе отказывается переводить сайт или его нет в интернете. Самый простой способ такой -- открываем пустой docx файл и копируем туда код сайта как текст. Он и есть текст. Затем просим ГуПе перевести документ. А после этого копируем новый текст в файл с расширением htm, используя простой текстовый редактор. Параллельно можно отредактировать возможные ошибки. Важно, что при переводе документов нет ограничений на размер текста. То есть таким способом можно переводить и просто тексты очень больших размеров. Почему так неуклюже сделан сайт ГуПе -- вопрос не ко мне. Спасибо и на том, что есть. Этот способ я пробовал, он работает. Но так же точно можно переводить и Латех файлы, то есть форматированные тексты научных статей. А потом, после исправления ошибок, получать из них pdf документы.

Но есть и другой способ, в котором сайт ГуПе формально совсем не используется. Дело в том, что еще много лет назад фирма Гугл одновременно с сайтом разработала код для сайтописателей. Достаточно было поставить этот код на сайт и он показывал кнопку выбора языка. Кнопка всего одна, так как сайт уже написан на каком то языке и его надо перевести на другие языки. Выбираем язык и сайт переводится на этот язык автоматически. Это было очень удобно, и я лично ставил такие кнопки на свои сайты. Однако сейчас они работают иначе. Причина -- почему фирма Гугл изменила свою политику -- выглядит примерно так, что мол они дают эту услугу бесплатно, а кто-то стал просить деньги за перевод, используя бесплатный сервис от Гугл.

И теперь сайты по кнопке не переводятся. Точнее не так, они переводятся только после регистрации сайта и его проверки фирмой Гугл. Но это уже не для всех и неудобно. Однако речь идет только о сайтах в интернете. Для сайтов на компьютере кнопка перевода работает как раньше и ее можно использовать. Итак, если у вас есть текст, то его надо превратить в сайт, поставить на сайт эту кнопку и использовать ее. Именно эту задачу и решает моя программа номер 74. Ей надо указать адрес вашего сайта на компьютере, прочитать как надо приготовить текст, затем немного его отредактировать в соответствии с инструкцией и после этого программа довольно быстро приготовит сайт и покажет его в браузере.

Это первая операция, которая интересна и сама по себе. Показанный сайт можно спасти в разных форматах, в том числе в pdf. По крайней мере Яндекс браузер сохраняет сайт в pdf формате, я пробовал. А потом выбираете нужный язык и сайт переводится на это язык. Но его надо обязательно весь просмотреть. Потому что текст переводится в тот момент, когда он появляется на экране. А текст может быть произвольно большим. Я тестировал программу на первой главе своей книги, в которой около 130 тысяч знаков. Переведенный текст можно снова спасти в pdf файл указанным выше способом.

Программа, в основном рассчитана на перевод книг и статей с большим содержанием текста. Но никто не мешает переводить и форматированный текст. Однако тут могут быть некоторые ограничения и это надо пробовать самостоятельно, так как проверить все форматы я не в состоянии. В будущем я это проверю. Пока проверялся просто текст. В будущем я также запишу видео на свой канал ВК Видео. Осталось дать ссылки на сайты.
Адрес сайта ГуПе такой (https://translate.google.com/).
Адрес моего сайта такой (http://kohnvict.narod.ru).
А мою программу ACLP можно скачать тут (https://kohnvict.ucoz.ru/vkacl/ACLnews.htm).

В первом варианте статьи я тут и закончил. Но практика показала, что не у всех все сразу получается. Бывает и так, что браузер сайт открывает, а текст не показывает. Так происходит при любой ошибке в коде сайта. Любой интерпретируемый язык программирования работает только до тех пор, пока не увидит ошибку. Ошибки он исправлять не умеет. В результате сайт показывается либо частично, либо никак. В данном случае сайт точно показывается, а вот текст -- не всегда. Если так случилось, значит не дочитали описание и не сделали что надо. В частности в самом начале текста надо поставить символы &1, а в самом конце -- &2 без пробелов и на той же строке.

Но бывает, что и дочитали и сделали, но случилась опечатка и опять ошибка. А опечатки часто сложно искать. Я напомню, что браузеры -- это тоже интерпретаторы скриптовых языков программирования, как и моя программа. Они не могут работать с ошибками, но они способны показать место, где ошибка сделана. Для этого необходимо нажать одновременно три клавиши [Ctrl] + [Shift] + [J]. И тогда в правой части окна браузера он вам покажет место и тип ошибки. Место наверняка будет в том файле, который был приготовлен на основе вашего текста. Будет указан номер строки. Остается туда посмотреть и понять, что и как надо исправить.

И еще раз внимательно прочитать описание работы программы. Оно дается прямо в файле входных данных и есть отдельное описание на моем сайте всех готовых программ. Вот ссылка на это описание (https://kohnvict.ucoz.ru/acl/aclp-info.htm). Для тех, кто понимает, я сочу сообщить, что сайт состоит из 4-х файлов. Они все находятся в папке программы (pro/b). При этом 3 файла стандартные, один из них называется (ini-fr01.htm). Это и есть главный файл сайта. Он использует остальные файлы. А ваш текст преобразуется в файл (textforsite.js). В нем к тексту добавляются минимальное форматирование на языке разметки html и немного кода на языке js. Вот в нем и могут быть ошибки, если что-то не так записали. Если необходимо перенести файлы сайта в другое место на компьютере, то надо копировать все 4 файла. Другие два файла имеют название (gt-select) и разный тип.

.