Можно макрос написать
Который будет заменять буквы латиницы на кириллицу и наёборот
И цифру 0 на букву О
или на юникодные спецсимволы
Но я бы такого уволил нафиг
Делать вам на работе нефига, много свободного времени. Может, проще было контрагента нахрен послать. Так и так, дорогой партнер, идите вы в жопу.
Пропустил слово отчет. Даже не знаю, что хуже: вредить коллегам или партнерам. Впрочем, один вариант такого поведения я одобрил бы - если бы получателем выступали налоговики :)
Надо административный штраф вводить для тех, кто только в pdf присылает документы, когда оттуда надо что-то копировать. Распозноване далеко не всегда помогает, т.к. там бывают сложные формы, которые ни одна распозновалка не может нормально перевести в нормальный формат.
А вот ещё случай был - прислали правительственной телеграммой какую-то нужную ссылку. Репрессии - дело плохое, но что с такими людьми делать - хрен его знает
Уборщик➦Лунтик• 20.02.24 22:52
Есть куча программ для редактирования pdf. Если специально не извращаться можно скопировать не только текст, но и печать. Но все еще проще. Есть сайт ilovepdf. Бесплатный и делает все что угодно.
Так это ж только дурак не поймет в чем дело. Сама же расписалась в собственной неадекватности.
Я бы ещё понял смысл всего этого, если бы оригинал был например в TeX. Самому приходилось красивые векторные картинки, подготовленные в MetaPost + LaTeX, делать растровыми для вставки в Word
Пиндохол➦Smylic• 21.02.24 03:11
Один препод требовал домашки сдавать в LaTeX, изверг. Больше никогда в жизни LaTeX не понадобился.
Ворд, фаршированный жареными ссылками не пробовали? Всыпать в HTML и перемешать.
Если страниц много, то устанешь делать скриншоты. А пдф можно автоматически сконвертировать в картинки и затем их всем скопом вставляешь в документ. Если поля а документе поставить в 0, то размер шрифта совпадет достаточно точно.
Старшему сыну пришлось диплом подобным макаром делать. У него был проект модернизации цеха металлообработки из мелкосерийного в крупносерийное производство. Так проверка на плагиат замучила -- ругалась на слова "станок", "деталь" и т.п. А уж формулы и таблицы с данными просто сразу вычеркивала как ворованные. Пришлось ему все формулы и таблицы переводить в картинки и уже их вставлять в диплом. Ну а стандартные слова "деталь" или "станок" заменить их моделями или артикулами...
Он проверяет на совпадение слов и предложений проверяемой работы и тех, что хранятся в базе (дипломов и курсовых за несколько предыдущих лет). Причем фильтров, которые бы отсекали, скажем так, стандартные слова и формулировки, без которых не обойтись, на тот момент не было.
Kroki ★➦WaIdemar• 20.02.24 15:19
Не проходило -- проверка на грамотность тоже была.
Был допустим плагиат не более 40%, а ошибок (или того, что таковыми посчитала программа) не более 20.
Но это лет 5 назад было.
P.S. Сейчас младший диплом пишет. У него похожая тема, только специализация цеха другая. Ему уже не пришлось подобным образом извращаться.
"У него был проект модернизации цеха металлообработки из мелкосерийного в крупносерийное производство"
Ну как инженер-технолог, хоть и не металлообработки, замечу - в первом приближении это означает снести все нафик и построить заново.
Модель детали - это как проект, т.е. "сырой" продукт. А вот деталь лна и в Африке деталь. А уж артикул - это вообще настолько плавающее понятие. Не, он конкретный, но только на конкретном предприятии. И заменять им слово "деталь" вообще некорректно.
Ну пересохорани их в pdf и через любую распознавалку прогони, делов то на копейку.
Кстати, помню давно читал статью, где чувак сделал программу, которая добавляет определенные шумы и искажения, почти невидимые в картинку и OCR начинает сильно ошибаться. Но сейчас думаю технология OCR такие искажения и шумы уже не испугают.