Приложение Б. Подготовка текста из различных библиотек
Вот, :) Михаил прислал письмо : |
|||
Как сделать eBookБлагодарности – Марку за ликбез и советы, Сергею – за утилиту. Предполагается, что шрифты в MS Reader понимают кириллицу. Если это не так, - то рецепты за рамками этой статьи. Мне лично помогли рекомендации Марка (на Кассиопее-125), а на десктопе оглавления и заглавия по русски не читаются до сих пор. Для текстов из библиотеки Мошкова www.lib.ru1.
Закачать файл (можно
Reget’ом) и присвоить
ему волевым решением расширение htm. 2.
Каким-нибудь редактором
HTML (но не
WORDом!!) проделать
следующее: 2.1.
в
начале текста удалить все строчки до начала собственно текста [первая
строчка с текстом без тегов]
- не начинающиеся с <dir>, с последующей вставкой спереди двух
строк 2.2.
удалить
в конце строчки между последней строчкой без тегов и </body></html> 3.
То,
что получится подсунуть утилите convert.exe
в качестве первого параметра. Вторым параметром – имя результирующего файла с
расширением htm,
а третьим – число пробелов в начале абзаца (я использую тройку). Исходный файл
должен быть в той же директории, что и convert.exe.
Имя
этой директории и весь путь к ней не должен содержать символов
кириллицы.
Там
же получится и результат. 4.
Присобачить
картинку (если надо). Для этого
добавьте еще одну строчку (для картинки): 5.
После конвертации отредактировать
название между тэгами <title> и </title> в начале
текста 6.
Запустить
ReaderWorks.
Не забыть аккуратно сделать название и автора в PROPERTIES. Файлы с альдебарана http://www.aldebaran.50g.com/detektiv/frenc/frenc.htm1.
Закачать файл (можно
Reget’ом) и присвоить ему
волевым решением расширение htm. 2.
Этот файл в кодировке
DOC. Его надо открыть
WORDом и сохранить как
txt. При этом число
символов не должно измениться, но кодировка будет уже
1251. 3.
Встречаются случаи, когда
необходима полу-ручная правка. Её можно делать средствами WORD. ·
Если в тексте встречаются
символы “<” (обычно при этом бывают еще и символы “>” в пару, то нужно их
заменить на "<" (соответственно
">"), иначе ReaderWorks будет ругаться на
несуществующие теги и текст будет искажен. ·
Если встречаются жесткие
переносы в конце строк, то можно все последовательности вида <жесткий
перенос> <конец абзаца> заменить на <мягкий перенос>. Это
делается через ПРАВКА-ЗАМЕНИТЬ с использованием кнопки СПЕЦИАЛЬНЫЙ.
Последовательность НАЙТИ выглядит как -^p, а последовательность
ЗАМЕНИТЬ – как ^- 4.
Далее см. п. 3 предыдущего
раздела. Файлы из http://rusf.ru/books/ или http://members.spree.com/entertainment/rostov_don/Час быка, например, Ивана Ефремова. 1.
Закачать файл (можно
Reget’ом) и присвоить ему
волевым решением расширение htm. 2.
Этот файл в кодировке
DOC. Его надо открыть
WORDом и сохранить как
txt. При этом число
символов не должно измениться, но кодировка будет уже
1251. 3.
Этот случай отличается от
предыдущего тем, что все абзацы начинаются без отступа. Чтобы придать тексту
более читабельный вид, я делаю WORDом сквозную замену
последовательности <конец абзаца> на последовательность <конец абзаца и
три пробела>. Дальше см. пункт 3 первого раздела. Замена символовПодробности стоит посмотреть в http://www.w3.org/TR/html4/charset.html#encodings Four
character entity references deserve special mention since they are frequently
used to escape special characters: "<"
represents the < sign. ">"
represents the > sign. "&"
represents the & sign. ""
represents the " mark. Там еще много всего, но пока это
в текстах не встречалось. |
|||
|