TopList


Приложение Б. Подготовка текста из различных библиотек

   Вот, :) Михаил прислал письмо :



Как сделать eBook

Благодарности – Марку за ликбез и советы, Сергею – за утилиту.

 

Предполагается, что шрифты в MS Reader понимают кириллицу. Если это не так, - то рецепты за рамками этой статьи. Мне лично помогли рекомендации Марка (на Кассиопее-125), а на десктопе оглавления и заглавия по русски не читаются до сих пор.

Для текстов из библиотеки Мошкова www.lib.ru

1.        Закачать файл (можно Reget’ом) и присвоить ему волевым решением расширение htm.

2.        Каким-нибудь редактором HTML (но не WORDом!!) проделать следующее:

2.1.      в начале текста удалить все строчки до начала собственно текста [первая строчка с текстом без тегов] - не начинающиеся с <dir>, с последующей вставкой спереди двух строк
    
<html><body> 
можно оставить первые несколько тегов как есть, например
      <html><head><title>Роберт Шекли. Варианты выбора</title></head><body>

2.2.      удалить в конце строчки между последней строчкой без тегов и </body></html>

3.        То, что получится подсунуть утилите convert.exe в качестве первого параметра. Вторым параметром – имя результирующего файла с расширением htm, а третьим – число пробелов в начале абзаца (я использую тройку). Исходный файл должен быть в той же директории, что и convert.exe. Имя этой директории и весь путь к ней не должен содержать символов кириллицы. Там же получится и результат.

4.        Присобачить картинку (если надо). Для этого  добавьте еще одну строчку (для картинки):
           <div align=center><img src="картинка.jpg" border="0"></div>
картинка.jpg - файл с обложкой 202x242 (выяснено эмпирическим путем :)). Постарайтесь соблюсти хотя бы высоту (242). Должна лежать в той же папке где и текст

5.         После конвертации отредактировать название между тэгами <title> и </title> в начале текста

6.        Запустить ReaderWorks. Не забыть аккуратно сделать название и автора в PROPERTIES.

Файлы с альдебарана http://www.aldebaran.50g.com/detektiv/frenc/frenc.htm

1.        Закачать файл (можно Reget’ом) и присвоить ему волевым решением расширение htm.

2.        Этот файл в кодировке DOC. Его надо открыть WORDом и сохранить как txt. При этом число символов не должно измениться, но кодировка будет уже 1251.

3.        Встречаются случаи, когда необходима полу-ручная правка. Её можно делать средствами WORD.

·              Если в тексте встречаются символы “<” (обычно при этом бывают еще и символы “>” в пару, то нужно их заменить на  "&lt;" (соответственно "&gt;"), иначе ReaderWorks будет ругаться на несуществующие теги и текст будет искажен.

·              Если встречаются жесткие переносы в конце строк, то можно все последовательности вида <жесткий перенос> <конец абзаца> заменить на <мягкий перенос>. Это делается через ПРАВКА-ЗАМЕНИТЬ с использованием кнопки СПЕЦИАЛЬНЫЙ. Последовательность НАЙТИ выглядит как -^p, а последовательность ЗАМЕНИТЬ – как ^-

4.        Далее см. п. 3 предыдущего раздела.

Файлы из http://rusf.ru/books/ или http://members.spree.com/entertainment/rostov_don/

Час быка, например, Ивана Ефремова.

1.        Закачать файл (можно Reget’ом) и присвоить ему волевым решением расширение htm.

2.        Этот файл в кодировке DOC. Его надо открыть WORDом и сохранить как txt. При этом число символов не должно измениться, но кодировка будет уже 1251.

3.        Этот случай отличается от предыдущего тем, что все абзацы начинаются без отступа. Чтобы придать тексту более читабельный вид, я делаю WORDом сквозную замену последовательности <конец абзаца> на последовательность <конец абзаца и три пробела>. Дальше см. пункт 3 первого раздела.

Замена символов

Подробности стоит посмотреть в

http://www.w3.org/TR/html4/charset.html#encodings

 

Four character entity references deserve special mention since they are frequently used to escape special characters:

"&lt;" represents the < sign.

"&gt;" represents the > sign.

"&amp;" represents the & sign.

"&quot; represents the " mark.

 

Там еще много всего, но пока это в текстах не встречалось.



  <<<  оглавление  >>>  
Хостинг от uCoz