Кабінет психопатологічної евтаназіології (
euthanasepam) wrote2019-06-09 12:23 pm
![[personal profile]](https://www.dreamwidth.org/img/silk/identity/user.png)
Про книжки, але не про книжки
Зауважу, що читати у перекладі книжки про щось комп’ютерне — то марно гаяти час*. Та я про інше.
Є дивні люде, що сканують переклади і запихають їх у непридатні для такого використання формати. Насамперед мова про PDF.
1. Перший, феноменальний приклад за цим лінком:
https://rutracker.org/forum/viewtopic.php?t=4941725
Скановані сторінки кни́жки запхали у файл формату PDF, цей файл має обсяг 605,36 MB (634770399 байтів). Шок!
2. А ось як зробили здорові люди:
http://libgen.is/book/index.php?md5=C19C5D1D73819802D21F80E4CD23794C
Формат DJVU, 34 MB (35139169 байтів), OCR 600 dpi.
3. Тут маємо ще кращий приклад (видання інше, та не в цьому суть):
http://libgen.is/book/index.php?md5=76EA4B822D3404FF7BDADC78DB430DD9
Формат знову DJVU, 5 MB (5074678 байтів). Скановані сторінки мають якість 600 dpi, у книжку вбудовано інтерактивний зміст. Читайте донесхочу.
Мораль мого допису така: не вмієш — не берись. А коли берешся — вивчи предмет. Формат PDF не призначено для збереження в ньому, як у контейнері, сканованих текстів. Для цього було спеціяльно створено формат DJVU. Ніколи не пхайте великі скановані документи у PDF, любі друзі. Чуєте? Ніколи цього не робіть.
________________________________
* https://rutracker.org/forum/viewtopic.php?p=66910349#66910349
no subject
Але тут! Комп'ютерна книжка значить автор хоч якось серйозно пов'язаний з комп'ютерами....
ганьба!
no subject
no subject
я також роблю djvu, але як додати туди text layer, то після djvu->pdf, останній виходить лише ув ~3 рази більше, e.g.
а оті 0.6 ГБ, то є приклад рук з дупи у свнсбк
no subject
P. S.
Ось як має виглядати нормальний PDF, коли його застосовано за призначенням:
https://euthanasepam.dreamwidth.org/88306.html
no subject
pdf'у є все одно
треба розуміти як правильно обробляти зіскановані сторінки, щоб виходили гарні та маленькі байтонал імеджес (що робить малий % тих хто викладає відскановані книжки), тоді різниця з djvu буде не дуже суттєва
а хамити у відповідь є зовсім необов'язково
no subject
no subject
Вы имеете представление о том, как устроен формат PDF? Эта информация открыта, это стандарт ISO, спецификация общедоступна. Загляните «внутрь» файла и в документы, описывающие его, начиная хотя бы с Википедии:
https://en.wikipedia.org/wiki/PDF#File_structure
https://tools.ietf.org/html/rfc3778
Особенно обращаю внимание на эту статью:
Why Do We Offer Two Printing Technologies? How Do They Differ? (By David Evans)
Нецелевое использование компьютерных изобретений малограмотными домохозяйками и пролетариями ещё как-то можно понять и простить. Но когда этим занимаются люди компьютерных профессий, то они расписываются в своей профнепригодности.
no subject
no subject
А вот засовывать в PDF большие отсканированные книги, не являющиеся иллюстрацией или приложением к основному документу — это признак ярко выраженной умственной недостаточности.
no subject
no subject
К сожалению, компания-создатель DJVU не приложила должных стараний для распространения формата и средств его подготовки, многие люди о нём даже не знают.