euthanasepam: Ла-ла-ла-ла! Ла-ла-ла-ла! (25)
Кабінет психопатологічної евтаназіології ([personal profile] euthanasepam) wrote2019-06-09 12:23 pm

Про книжки, але не про книжки

 

Зауважу, що читати у перекладі книжки про щось комп’ютерне — то марно гаяти час*. Та я про інше.

Є дивні люде, що сканують переклади і запихають їх у непридатні для такого використання формати. Насамперед мова про PDF.


1. Перший, феноменальний приклад за цим лінком:

https://rutracker.org/forum/viewtopic.php?t=4941725

Скановані сторінки кни́жки запхали у файл формату PDF, цей файл має обсяг 605,36 MB (634770399 байтів). Шок!


2. А ось як зробили здорові люди:

http://libgen.is/book/index.php?md5=C19C5D1D73819802D21F80E4CD23794C

Формат DJVU, 34 MB (35139169 байтів), OCR 600 dpi.


3. Тут маємо ще кращий приклад (видання інше, та не в цьому суть):

http://libgen.is/book/index.php?md5=76EA4B822D3404FF7BDADC78DB430DD9

Формат знову DJVU, 5 MB (5074678 байтів). Скановані сторінки мають якість 600 dpi, у книжку вбудовано інтерактивний зміст. Читайте донесхочу.


Мораль мого допису така: не вмієш — не берись. А коли берешся — вивчи предмет. Формат PDF не призначено для збереження в ньому, як у контейнері, сканованих текстів. Для цього було спеціяльно створено формат DJVU. Ніколи не пхайте великі скановані документи у PDF, любі друзі. Чуєте? Ніколи цього не робіть.


________________________________
* https://rutracker.org/forum/viewtopic.php?p=66910349#66910349




 
picterman: (Default)

[personal profile] picterman 2019-06-09 10:02 am (UTC)(link)
Колись, коли тільки модно було тягати журнали з файлообмінників, такими речами балувалися з архітектурними, дизайнерськими, фотографічними журналами...
Але тут! Комп'ютерна книжка значить автор хоч якось серйозно пов'язаний з комп'ютерами....
ганьба!
Edited 2019-06-09 10:03 (UTC)
henry_flower: A melancholy wolf (Default)

[personal profile] henry_flower 2019-06-09 11:36 am (UTC)(link)
все з pdf є нормально, але треба вміти їм користуватися

я також роблю djvu, але як додати туди text layer, то після djvu->pdf, останній виходить лише ув ~3 рази більше, e.g.

$ du -h _out/*
9.0M    _out/book.djvu
30M     _out/book.pdf


а оті 0.6 ГБ, то є приклад рук з дупи у свнсбк
henry_flower: A melancholy wolf (Default)

[personal profile] henry_flower 2019-06-09 12:13 pm (UTC)(link)

pdf'у є все одно

треба розуміти як правильно обробляти зіскановані сторінки, щоб виходили гарні та маленькі байтонал імеджес (що робить малий % тих хто викладає відскановані книжки), тоді різниця з djvu буде не дуже суттєва

а хамити у відповідь є зовсім необов'язково

[personal profile] pan_netnet 2019-06-09 12:46 pm (UTC)(link)
По моим наблюдениям смотря в каком качества сканить и каком формате сохранять. Как-то вставлял товарищам сканящим доки в .png с dpi этак за 2000. Получалcя месячный файл этак в полтора гига. А вот в .jpeg dpi 200-400 с последующим конвертированием в пдф норм.

[personal profile] pan_netnet 2019-06-18 10:25 am (UTC)(link)
Вот только бы это бюрократам объяснили. У них же pdf стандаарт элетроного документооборота.

[personal profile] pan_netnet 2019-06-26 10:34 am (UTC)(link)
Нет ничего плохого, если вордовский текст конвертируется в пдф, подписывается ЭЦП. А если берется бумажный документ, сканится и таких доков этак полтыщи страниц одним файлом, то получаются мостры по 0.5-2 гб.
Edited 2019-06-26 10:34 (UTC)