euthanasepam: Ла-ла-ла-ла! Ла-ла-ла-ла! (25)
Кабінет психопатологічної евтаназіології ([personal profile] euthanasepam) wrote2019-06-09 12:23 pm

Про книжки, але не про книжки

 

Зауважу, що читати у перекладі книжки про щось комп’ютерне — то марно гаяти час*. Та я про інше.

Є дивні люде, що сканують переклади і запихають їх у непридатні для такого використання формати. Насамперед мова про PDF.


1. Перший, феноменальний приклад за цим лінком:

https://rutracker.org/forum/viewtopic.php?t=4941725

Скановані сторінки кни́жки запхали у файл формату PDF, цей файл має обсяг 605,36 MB (634770399 байтів). Шок!


2. А ось як зробили здорові люди:

http://libgen.is/book/index.php?md5=C19C5D1D73819802D21F80E4CD23794C

Формат DJVU, 34 MB (35139169 байтів), OCR 600 dpi.


3. Тут маємо ще кращий приклад (видання інше, та не в цьому суть):

http://libgen.is/book/index.php?md5=76EA4B822D3404FF7BDADC78DB430DD9

Формат знову DJVU, 5 MB (5074678 байтів). Скановані сторінки мають якість 600 dpi, у книжку вбудовано інтерактивний зміст. Читайте донесхочу.


Мораль мого допису така: не вмієш — не берись. А коли берешся — вивчи предмет. Формат PDF не призначено для збереження в ньому, як у контейнері, сканованих текстів. Для цього було спеціяльно створено формат DJVU. Ніколи не пхайте великі скановані документи у PDF, любі друзі. Чуєте? Ніколи цього не робіть.


________________________________
* https://rutracker.org/forum/viewtopic.php?p=66910349#66910349




 

[personal profile] pan_netnet 2019-06-09 12:46 pm (UTC)(link)
По моим наблюдениям смотря в каком качества сканить и каком формате сохранять. Как-то вставлял товарищам сканящим доки в .png с dpi этак за 2000. Получалcя месячный файл этак в полтора гига. А вот в .jpeg dpi 200-400 с последующим конвертированием в пдф норм.

[personal profile] pan_netnet 2019-06-18 10:25 am (UTC)(link)
Вот только бы это бюрократам объяснили. У них же pdf стандаарт элетроного документооборота.

[personal profile] pan_netnet 2019-06-26 10:34 am (UTC)(link)
Нет ничего плохого, если вордовский текст конвертируется в пдф, подписывается ЭЦП. А если берется бумажный документ, сканится и таких доков этак полтыщи страниц одним файлом, то получаются мостры по 0.5-2 гб.
Edited 2019-06-26 10:34 (UTC)