Московский государственный университет печати

Гасов В.М.
Цыганенко А.М.


         

Методы и средства подготовки электронных изданий

Учебное пособие


Гасов В.М.
Методы и средства подготовки электронных изданий
Начало
Печатный оригинал
Об электронном издании
Оглавление

Введение

1.

Глава 1. Основные компоненты электронных изданий

1.1.

Текстовая информация

1.2.

Полутоновые и цветные иллюстрации

1.3.

Анимационная графика

1.4.

Видеоинформация

1.5.

Аудиоинформация

2.

Глава 2. Технологии гипертекстовых изданий

2.1.

Функции гипертекстовых электронных изданий

2.2.

Принципы построения гипертекстовых изданий

2.3.

Математическая модель гипертекста

2.4.

Гипертекстовые Web-документы

2.5.

Подготовка публикаций в среде Adobe Acrobat

2.6.

Технология Help-файлов

2.7.

Средства доставки электронных изданий

2.8.

Классификация и общие принципы оформления электронных изданий

3.

Глава 3. Цифровое представление текстовой информации

3.1.

Стандарты кодирования символов ASCII, ANSI, КОИ-8 и UNICODE

3.2.

Формат PDF

3.3.

Формат разметки текста RTF

4.

Глава 4. Графические форматы

4.1.

Растровый формат GIF

4.2.

Формат графических файлов PNG

4.3.

Графический формат JPEG

4.4.

Формат TIFF

4.5.

Программные средства преобразования форматов

5.

Глава 5. Представление анимационной, видео- и звуковой информации

5.1.

Семейство форматов MPEG

5.1.1.

Компрессия видеоданных в MPEG

5.1.2.

Формат MPEG-1

5.1.3.

Формат MPEG-2

5.1.4.

Формат MPEG-4

5.1.5.

Формат MPEG-7

5.2.

Звуковые форматы

5.3.

Анимационные файловые форматы FLI, FLC, CEL

6.

Глава 6. Программы просмотра Web-публикаций

6.1.

Доступ к Web-странице в Internet

6.2.

Программа просмотра MS Internet Explorer

6.3.

Программа просмотра Netscape Navigator

7.

Глава 7. Языки разметки гипертекста и программирования скриптов

7.1.

Язык разметки гипертекста НТМL

7.2.

Расширенный язык разметки XML

7.3.

Язык Java

7.4.

Язык JavaScript

7.5.

Язык программирования сценариев PHP

7.6.

Язык Perl

7.7.

Язык моделирования виртуальной реальности VRML

8.

Глава 8. Программирование Web-страниц в языковой среде HTML

8.1.

Структура и форматирование HTML-документа

8.2.

Таблицы

8.3.

Изображения и навигационные карты

8.4.

Формы

8.5.

Фреймы

8.6.

Фреймы и таблицы

8.7.

Объекты

8.8.

Гиперссылки

8.9.

Таблицы стилей

9.

Глава 9. Автоматизация создания Web-публикаций. Программный пакет Macromedia Dreamweaver

9.1.

Назначение и функциональные возможности пакета

9.2.

Структурная схема программного пакета

9.3.

Интерфейс пользователя и принципы его организации

9.4.

Некоторые типовые процедуры пакета Dreamweaver

9.4.1.

Работа с текстом

9.4.2.

Вставка изображений

9.4.3.

Создание карты изображения

9.4.4.

Работа с таблицами

9.4.5.

Создание форм

9.4.6.

Работа с фреймами

9.4.7.

Работа со слоями

9.5.

Использование интерактивных возможностей и анимации

9.6.

Создание Web-сайта

10.

Глава 10. Программный пакет MS FrontPage

10.1.

Функциональные возможности программного пакета

10.2.

Структурная схема пакета

10.3.

Пользовательский интерфейс FrontPage

10.4.

Типовые процедуры работы с пакетом

10.5.

Пример создания Web-страницы

11.

Глава 11. Создание мультимедийных изданий. Программный пакет Macromedia Director

11.1.

Функциональные возможности программной среды

11.2.

Интерфейс пользователя

11.3.

Работа с мультимедийными элементами

11.3.1.

Элементы труппы

11.3.2.

Спрайты

11.3.3.

Изображения

11.3.4.

Текст

11.3.5.

Анимация

11.3.6.

Аудиоинформация

11.3.7.

Создание проекторов

11.3.8.

Цифровая видеоинформация

11.4.

Пример мультимедийного гиперграфического издания

Заключение

Библиографический список

Указатели
695   предметный указатель
434   указатель иллюстраций
45   указатель компаний
Рис. 03.01. Расширенный набор символов IBM (упорядочен по возрастанию значений кода символов) Рис. 03.02. Набор символов ANSI (упорядочен по возрастанию значения кода) Рис. 03.03. Кодировки символов кириллицы Рис. 03.04. Обобщенная структура формата PDF Рис. 03.05. Структура файла формата PDF Рис. 03.06. Структура публикации в формате PDF Рис. 03.07. Структура формата RTF

Представление текстовой информации в электронных публикациях осуществляется с помощью стандартов кодирования текста (символов) и текстовых форматов. На данный момент их перечень весьма ограничен. В качестве стандартов кодирования символов используются ASCII, ANSI, UNICODE. Из множества известных форматов в электронных изданиях нашел применение формат PDF, форматPDF, предложенный фирмой Adobe SystemsAdobe Systems для программных средств создания и просмотра электронных изданий Adobe Acrobat, программный пакетAdobe Acrobat. Стандартом де-факто является формат RTF, предложенный фирмой MicrosoftMicrosoft для организации обмена текстовой и графической информацией. Однако его применение в электронных изданиях весьма ограничено.

Представление символов в электронных изданиях базируется на таблицах кодов, в которых каждому из отображаемых на экране символов соответствует код от 0 до 255. Первые 127 кодовых комбинаций используются для латинских букв и цифр, знаков пунктуации и т. д. и, как правило, строятся по единому принципу.

Стандарт представления символов ASCIIСтандарт представления символов ASCII - это 7-битовое описание кода символа. Поскольку в персональных компьютерах используются байты, состоящие из 8 бит, производители компьютеров часто определяют наборы символов, использующие 256 кодов вместо 128 кодов ASCII. В результате получается «расширенный набор символов» (extended character set), который включает в себя набор символов ASCII и до 128 других символов.

В начале 80-х годов производители IBM PC решили расширить набор символов ASCII так, как показано на рис. 3.1Рис. 03.01. Расширенный набор символов IBM (упорядочен по возрастанию значений кода символов). Коды от 20h до 7Ah - это выводимые на дисплей символы из набора символов ASCII. Оставшиеся символы являются нестандартными или, по крайней мере, на тот момент являлись нестандартными.

Этот набор символов закодирован в миллионах микросхем ПЗУ в видеоадаптерах, принтерах и микросхемах BIOS. Он был растиражирован в аппаратуре многочисленных производителей IBM-ориентированных компьютеров и периферии. Для множества программ, работающих в текстовом режиме и написанных не для MS Windows, требуется этот расширенный набор символов, поскольку в них для вывода информации на экран используются символы псевдографики - символы блоков и линий (коды от В0h до D0h).

Известно несколько вариантов кодирования символов IBM, которые называются «кодовые страницы» (code pages). Вариант, используемый в Соединенных Штатах Америки и большинстве европейских стран, называется Code Page 437. В системах, распространенных в Норвегии, Дании, Португалии и некоторых других странах Европы, используются другие специальные кодовые страницы, в которых содержится большее количество специальных символов, необходимых для языков этих стран. В последнее время некоторые страны начали применять кодовую страницу Code Page 850, в которой содержится меньшее количество псевдографических символов. За счет этого введены дополнительные символы, знаки ударения и другие специальные символы.

Расширенный набор символов, который Windows и программы для Windows в большинстве случаев используют, называется Набор символов ANSIнабор символов ANSI (ANSI character set), фактически он является международным стандартом ISO. Кодовая таблица стандарта ANSI представлена на рис. 3.2Рис. 03.02. Набор символов ANSI (упорядочен по возрастанию значения кода).

В нашей стране кодовые комбинации начиная со 128 используются для кодирования символов кириллицы, математических символов и другой информации. Причем для каждой платформы используется свое расположение символов в кодовой таблице. Так, известны кодировки Windows, Mac, DOS-OS/2, ISO (Dec) и КОИ-8. Поэтому приходится осуществлять перекодировки символов кириллицы электронных изданий в зависимости от используемой платформы.

Справедливости ради следует отметить, что существуют нормативы: «Основная кодировка ГОСТа», «Альтернативная кодировка ГОСТа» и кодировка КОИ-8. В последнем случае символы кириллицы имеют коды: А-Я - 224-254 (не в алфавитном порядке); а-я - 192-223 (не в алфавитном порядке).

По мнению специалистов, «Альтернативная кодировка ГОСТа» использует под кодировки символов кириллицы позиции, где в кодировке IBM расположены относительно редко используемые символы национальных алфавитов, греческие буквы и некоторые математические символы.

На рис. 3.3Рис. 03.03. Кодировки символов кириллицы приведена таблица кодировки символов кириллицы для «Альтернативной кодировки ГОСТа» (Alt), «Основной кодировки ГОСТа» (Mai), кодировки MIC и КОИ-8.

Стандарт кодировки символов UNICODEСтандарт кодировки символов UNICODE. Стандарт Unicode был предложен некоммерческой организацией Unicode Consortium, образованной в 1991 г. Для представления каждого символа в этом стандарте используются два байта: один байт для кодирования символа, другой для кодирования признака. Тем самым обеспечивается информационная совместимость данного способа кодирования со стандартом ASСII.

Двухбайтовое описание кодов символов позволяет закодировать очень большое число символов из различных письменностей. Так, в документах Unicode могут соседствовать русские, латинские, греческие буквы, китайские иероглифы и математические символы.

Кодовое пространство Unicode разделено на несколько областей. Область с кодами от 0000 до 007F содержит символы набора Latin 1 (младшие байты соответствуют кодировке ISO 8859-1). Далее идут области, в которых расположены знаки различных письменностей, а также знаки пунктуации и технические символы. Часть кодов зарезервирована для использования в будущем (29000). 6000 кодовых комбинаций оставлено программистам.

Символам кириллицы выделены коды в диапазоне от 0400 до 0451.

НижеСм. переход по ссылке. - Прим. редактора электронного издания. приведена основополагающая таблица использования кодового пространства Unicode.

В документах Unicode используются различные шрифты. Как правило, файл шрифта Unicode содержит начертания не для всех символов, определенных в стандарте, а лишь для символов из некоторых областей.

Некоторые программы, например ядро Windows NTWindows NT, ее графический интерфейс (GDI) и файловая система (NTFS), реализованы с использованием Unicode. Программы, запущенные в среде NT, могут работать также с однобайтовыми символами, кодировка которых в этом случае соответствует установленной по умолчанию кодовой странице ANSI (для России - Windows Cyrillic).

Перед вызовом некоторых функций программного интерфейса NT программы, работающие с кодовой страницей ANSI, преобразуют однобайтовые символы в Unicode. Чтобы преобразование выполнялось без ошибок, обычно указывается страна в приложении Regional Settings. Такой же подход используется для корректной работы с национальными символами программ в среде MS-DOS.

В отличие от Windows NT ядро и графический интерфейс Windows 95 не используют Unicode, а работают с кодовыми страницами. Однако в этой системе предусмотрена возможность динамического изменения наборов символов и раскладок клавиатуры, что позволяет создавать документы, содержащие одновременно символы из разных наборов. Буфер обмена Windows 95 способен хранить тексты в формате CF_UNICODETEXT. В составе Windows 95 и более поздних версий поставляется набор шрифтов Unicode, с которыми, в частности, могут работать программы Microsoft Office.

Выяснить, какие наборы символов присутствуют в том или ином шрифте Unicode, можно с помощью стандартной утилиты Character Map (таблица символов), включенной в состав Windows NT. Выбрав в списке Subset строку Cyrillic, вы увидите таблицу с символами кириллицы, соответствующую кириллической области Unicode.

Использование Unicode значительно упрощает создание многоязычных документов, публикаций и программных приложений. Поэтому следует ожидать его широкого применения в электронных изданиях.

PDF, форматФормат PDF (Portable Document Format) - переносимый формат документов, разработанный компанией Adobe SystemsAdobe Systems, используется как основа для создания электронных изданий в среде программного пакета Adobe Acrobat, программный пакетAdobe Acrobat. Формат PDF - это файловый текстовой формат, предназначенный для представления публикаций или других документов на любой аппаратной платформе и в любой операционной среде. PDF-файл содержит PDF-публикацию и специальные данные.

PDF-публикация (документ) содержит одну или более страниц. Каждая страница может включать любые компоненты электронного издания: текст, графику и иллюстрации, анимацию, видео- и аудиоинформацию в аппаратно-независимом формате, в виде так называемого страничного описания (page description). PDF-публикация может также содержать информацию, обеспечивающую навигацию в гипертекстовой электронной публикации.

Кроме того, публикация содержит версию спецификации PDF, использованную в конкретном файле, и информацию о расположении структуры файла.

Формат PDF представляет текст и графику, используя модель формирования изображений языка программирования полос PostScript. Графическими объектами могут быть тексты и формы публикаций, Векторные изображениявекторные и Растровые изображениярастровые изображения и т.д. Графические объекты могут быть любого цвета.

Операторы создания страниц PDF подобны операторам языка PostScript. Главное отличие состоит в том, что PDF не программный язык, он не содержит процедур, переменных и т.п.

Характерными особенностями PDF-файла являются:

  • PDF-файл может содержать объекты, подобные гипертекстовым ссылкам, доступные только при интерактивном просмотре;

  • для упрощения процесса описания страниц PDF не использует конструкции программных языков;

  • PDF создает определенную структуру файла, которая позволяет программным приложениям иметь доступ к любой части документа;

  • PDF-файл содержит информацию о размерах шрифта и т.п.;

  • PDF-файл не может быть прямо преобразован в PostScript-публикацию для печати;

  • PDF-файл строится на основе либо 7-битового ASCII-файла, либо на базе бинарного файла. Если это ASCII-файл, в нем используются только печатные символы 7-битового ASCII-кода, пробел, табуляция, возврат каретки и перевод строки. В случае бинарного файла могут быть использованы все символы 8-битового кода. Считается, что ASCII-код - наиболее удобный для переноса вид кодировки.

Для уменьшения размера файла PDF использует различные методы сжатия изображений:

  • JPEG - для полноцветных иллюстраций и изображений в градациях серой шкалы;

  • CCITT - для черно-белых изображений;

  • LZW - для компрессии и декомпрессии текстового материала.

Все эти методы оперируют с двоичными данными, которые затем могут быть закодированы в коде ASCII. Для обеспечения независимости от шрифтов PDF-файл содержит описание для каждого шрифта, использованного в публикации. Описание включает название, кегль (размер) и стиль шрифта. В режиме просмотра публикации, если шрифт, использованный в документе, доступен, то он используется. Если недоступен, то заменяется на подобный с тем же кеглем и другими характеристиками. Некоторые шрифты могут встраиваться в PDF-публикацию.

Для прямого поиска любой страницы файла PDF-файл содержит специальную таблицу ссылок. Таблица размещается в конце файла и способствует уменьшению времени поиска и вывода страницы в PDF-публикации, так как обеспечивает независимость времени поиска от общего количества страниц в документе.

Структура PDF-формата представлена в виде схемы на рис. 3.4Рис. 03.04. Обобщенная структура формата PDF.

Объекты. PDF, форматФормат PDF поддерживает несколько основных типов объектов, например:

  • bollean - логические (true, false);

  • number - числовые (integer, real);

  • string - последовательность символов в круглых скобках;

  • array - последовательность PDF-объектов различных типов;

  • dictionary - таблицы, состоящие из двух элементов: ключа и значения (используются для соединения атрибутов сложных объектов, например, в PDF-публикациях с помощью этих объектов представляются страницы и шрифты);

  • stream - в виде объекта типа stream представлены большие объемы данных, такие, как изображения и описания страниц.

Кроме того, существует «нулевой» объект (ключевое слово - null).

Косвенные объекты могут быть помечены так, чтобы на них ссылались другие объекты. Это используется, например, для создания объекта, значение которого изначально не известно. Любой тип объекта может быть помечен как косвенный. Такой объект содержит идентификатор объекта, который сохраняется даже при изменении самого объекта.

Любой объект, использующийся как элемент массива или значение dictionary, может быть определен либо как обычный объект, либо как косвенная ссылка. Косвенная ссылка - это ссылка на косвенный объект, содержащая номер косвенного объекта (идентификатор) и ключевое слово R.

Структура файла. Структуру файла формата PDF можно представить в виде схемы, приведенной на рис. 3.5Рис. 03.05. Структура файла формата PDF. Эта структура обеспечивает быстрый доступ к любой части файла и содержит механизм для его изменения.

Обычный PDF-файл содержит четыре раздела:

  • заголовок (header);

  • «тело файла» (body);

  • таблицу перекрестных ссылок (cross-reference table);

  • trailer.

Заголовок. Первая строка PDF-файла определяет номер спецификации PDF, которой придерживается данный файл (текущая - 1.2% PDF-1.2).

<header> ::= <PDF version>

Тело файла. Содержит последовательность косвенных объектов, входящих в состав публикации. Объекты - это компоненты публикации: страницы, изображения, шрифты. Комментарии могут быть во всем PDF-файле. Их синтаксис совпадает с синтаксисом комментариев в PostScript, они начинаются с % и заканчиваются символом конца строки.

Таблица перекрестных ссылок. Таблица содержит информацию о каждом объекте в файле в виде одной строки описания места объекта в файле. PDF-файл содержит таблицу, состоящую из одного или более разделов. Если нет изменений или добавлений в файл, таблица состоит из одного раздела. В противном случае в ее состав добавляется новый раздел.

Приведем описание раздела таблицы, состоящего из подразделов. Каждый подраздел включает данные для непрерывной области номеров объектов. Организация подразделов удобна для пошагового изменения, потому что допускает добавление нового раздела перекрестной ссылки, содержащей данные об объектах, которые были добавлены или удалены.

Каждый подраздел перекрестной ссылки начинается со строки заголовка, содержащей два числа: объектный номер в этом подразделе и номер данных в подразделе.

Есть два формата данных таблицы: для объектов, которые используются, и для объектов, которые были удалены.

<cross-reference entry> ::=

<in-use entry> |

<free entry>

Для объекта, который используется в публикации, указываются байтовое смещение, определяющее количество байтов от начала файла к началу объекта, номер генерации объекта, и ключевое слово n: <in-use entry> ::= <byte offset><generation number> n. Для объекта, который свободен, указываются объектный номер следующего свободного объекта, номер генерации и ключевое слово f: <free entry> ::= <object number of next free object><generation number> f.

Когда косвенный объект удаляется, его запись в таблице помечается как «свободная», и номер генерации объекта увеличивается на единицу, чтобы открыть возможность использования объекта с таким номером.

Trailer позволяет программному приложению при чтении PDF-файла быстро находить таблицу перекрестных ссылок и специальные объекты. Приложения должны читать PDF-файл с конца. Последняя строка содержит маркер конца файла %%EOF; две предшествующие строки - ключевое слово startxref и байт смещения от начала файла к началу слова xref в последнем разделе таблицы ссылок в файле. Trailer dictionary предшествует этой строке.

Атрибуты trailer показывают смещения от начала файла к месту расположения последнего после изменения раздела таблицы ссылок, каталог объектов для публикации (в виде dictionary), массив двух string-идентификаторов создания и изменения файла, информацию для декодирования документов и т.п.

Пошаговая коррекция документа. Содержимое PDF-файла может быть изменено без переписывания всего файла. Изменения можно внести в конец файла, сохраняя его первоначальное содержание. Когда файл модифицируется, добавляются новые или измененные объекты, раздел таблицы ссылок и новый trailer. Удаленные объекты остаются неизменными в файле, но помечаются как удаленные в таблице ссылок.

Шифрование документа. Документы или публикации могут быть зашифрованы для защиты их содержимого от несанкционированного доступа. Доступ к защищенному содержимому документа контролируется специальным «механизмом», определенным в таблице dictionary шифрования - значение Encrypt ключа в dictionary trailer.

Защита данных в файле PDF состоит из двух шагов: вычисление ключа, который должен использоваться, чтобы закодировать данные, и шифрование данных. Ключ является строкой (string) из пяти байтов. Для шифрования используется RC4 - симметричный алгоритм, который может применяться как для шифрования, так и для дешифрования. Алгоритм RC4 не меняет длины данных.

Структура PDF-публикации. PDF-публикация может быть описана как иерархия объектов, содержащихся в «теле» PDF-файла. Структура PDF-публикации (документа) представлена на рис. 3.6Рис. 03.06. Структура публикации в формате PDF.

Основными объектами в этой иерархии являются таблицы dictionary. Связи в иерархии представлены парами ключ - значение, в которых значение - косвенная ссылка на родитель-ский или дочерний объект. Например, объект Catalog, который является «корнем» иерархического дерева, содержит «ключ страниц» и соответствующее ему значение - косвенную ссылку на объект корень «дерева» страниц (Pages tree).

Каждая страница документа включает ссылки на свои изображения, миниатюры и комментарии, которые появляются на странице. Trailer PDF-файла, описанный выше, определяет место объекта Catalog в виде значения корневого ключа (Root) в trailer. Кроме того, trailer задает с помощью ключа Info место информационной таблице dictionary публикации, т.е. структуре, которая содержит общие сведения о документе.

Каталог (Catalog). Catalog - объект типа dictionary, являющийся корневым узлом документа. Он содержит ссылки на дерево страниц в документе, ссылку на дерево объектов, представляющих схему документа (bookmarks или outline), ссылки на статьи и список named destinations. Catalog показывает также, появляется ли схема публикации или миниатюры автоматически, когда документ просматривается (задается атрибутом типа имени со значениями: UseNone, UseOutlines, UseThumbs, Full-Screen), и должна ли быть воспроизведена при открытии иная, чем первая страница. С помощью этого объекта атрибутом ViewerPreferences можно задать также параметры программы просмотра при открытии публикации.

Пример объекта Catalog:

1 0 obj

<<

/Type /Catalog

/Pages 2 0 R

/Outlines 3 0 R

/PageMode /UseOutlines

>>

endobj

Дерево страниц (Pages tree). Доступ к страницам документа открывается через дерево узлов, названное деревом страниц. Это дерево определяет порядок страниц в документе. Для оптимизации производительности программы просмотра Acrobat Distiller и Acrobat PDF Writer конструируют сбалансированное дерево. Структура дерева позволяет приложению быстро открыть документ, содержащий тысячи страниц, используя ограниченный объем памяти. Простейшая структура состоит из единственного узла страниц, который ссылается на все страничные объекты. Структура дерева страниц документа не связана с содержимым документа. В PDF-файле книги, например, не гарантируется, что глава представлена одним узлом в дереве. Корень и все другие узлы дерева страниц являются объектами типа dictionary. Их основные атрибуты: имя - Pages, список косвенных ссылок на непосредственные дочерние узлы, объект-предок типа dictionary.

Пример:

2 0 obj

<<

/Type /Pages

/Kids [4 0 R 10 0 R 24 0 R]

/Count 3

>>

endobj

Объект «Страницы» может содержать также дополнительные ключи со значениями для объектов-потомков. Такие значения называются наследованными. Например, документ может задавать объект MediaBox для всех страниц, определяя один такой объект в корневом объекте дерева, а каждая страница в документе может перегрузить MediaBox собственным, соответствующим этой странице объектом MediaBox.

Объекты страницы (pages). Эти объекты являются объектами типа dictionary, ключи которого описывают текст, содержащийся на одной странице, и изображения. Основные атрибуты: имя - Page, MediaBox Rectangle - определяет «настоящий размер» страницы, Crop box - размер для печати, Parent - объект, непосредственный предок страницы, Resources - типа dictionary (ресурсы, требующиеся этой странице), Contents - типа stream (определяет страничное описание посредством косвенной ссылки), Thumb - типа stream (содержит ссылку на миниатюру), Annots - типа array (содержит массив объектов, который определяет комментарии на страницу), B - array (если страница содержит части статей), H - boolean (true - страница скрыта во время показа документа) и т.п.

Пример иллюстрирует страницу с миниатюрой и двумя комментариями.

3 0 obj

<<

/Type /Page

/Parent 4 0 R

/MediaBox [0 0 612 792]

/Resources <<

/Font << /F3 7 0 R /F5 9 0 R /F7 11 0 R >>

/ProcSet [/PDF] >>

/Thumb 12 0 R

/Contents 14 0 R

/Annots [23 0 R 24 0 R]

>>

endobj

Три ключа объекта Page: Dur (время показа), Hid (скрытие страницы) и Trans (описывает «эффект» при переходе к данной странице) - содержат информацию, которая используется только в режиме «презентации» и игнорируется в противном случае.

Миниатюры (Thumbnail). PDF-документ может включать миниатюрные схемы страниц. Миниатюра задается значением ключа Thumb объекта страницы. Структура миниатюры подобна, за небольшими исключениями, структуре изображения (см. ниже).

Комментарии (Annotations). Комментарии - это заметки или другие объекты, которые связаны со страницей, но описываются отдельно от дескриптора страницы. PDF поддерживает несколько видов комментариев: текстовые, гипертекстовые связи, видео- и аудиоинформацию.

Если страница содержит комментарии, то они сохраняются в массиве как значение Annots ключа объекта страница. Каждый комментарий - объект типа dictionary. Основными ключами комментария являются: Type, Subtype, Rect. Другие ключи, определяющие цвет (С), заголовок (T), рамку (Border или BS) и т.п., не являются обязательными.

Дерево закладок - Outline tree (bookmarks tree). Структура предоставляет пользователю возможность иметь доступ к различным видам публикации по имени. Активация outline entry (или bookmark - закладки) «переносит» на новый вид, заданный в так называемом «описании места назначения» (destination description) для bookmark. Закладки часто образуют иерархическую структуру. Если документ включает закладки, они доступны по ключу Outlines в Catalog-объекте. Значение этого ключа - корень дерева закладок. Закладка верхнего уровня содержит связный список. В процессе просмотра закладки появляются в той последовательности, в какой они входят в данный список. Основные атрибуты этого объекта типа dictionary: Count (общее количество открытых закладок), First (ссылка на начало списка), Last (ссылка на конец списка).

Пример:

21 0 obj

<<

/Count 6

/First 22 0 R

/Last 29 0 R

>>

endobj

Атрибуты закладки: Title - название, Dest типа array или name - место назначения (Destination), A - действие, выполняемое при активации закладки, Parent - ссылка на закладку верхнего уровня иерархии, Prev - ссылка на предыдущую закладку, Next - ссылка на следующую закладку.

Пример:

22 0 obj

<<

/Parent 21 0 R

/Dest [3 0 R /Top 0 792 0]

/Title (Document)

/Next 29 0 R

/First 25 0 R

/Last 28 0 R

/Count 4

>>

endobj

Место назначения (Destinations). Комментарии и закладки могут определять место назначения, которое состоит из страницы, места на странице и масштаба показа страницы. Назначение может быть представлено явно как массив или посредством имени. В первом случае значениями ключа Dest являются непосредственно данные о странице - Page, Top, Bottom, Left, Right, Zoom, в различных комбинациях задающие страницу и показанный на ней «прямоугольник». Поименованные места назначения (тип string или name) часто применяются, когда закладка ссылается на другой файл. Catalog документа может содержать ключ Names со значениями, каждое из которых представляет собой дерево, подобное дереву страниц. «Листья» содержат пары из strings и косвенных объектов, которые и являются destinations.

Дерево имен (Name tree). Дерево имен похоже на дерево страниц, но листья содержат пары string (имен) и объектов. Такое дерево применяется для организации поименованных мест назначения. Оно состоит из узлов трех видов: корень, промежуточное, листья. Корень содержит атрибуты Kids-массив и Limits-массив. Лист содержит Limits и массив Names (форма массива name value name value ..., где value - косвенная ссылка на объект). Имена в дереве сохраняются только в листьях.

Информационный объект типа dictionary (Info dictionary). Как упоминалось выше, trailer документа может включать ссылки на Info dictionary, который содержит информацию о публикации. Значения строковых атрибутов этого объекта представляют собой информационное окно документа в Acrobat. В качестве атрибутов используются: Author, CreationDate, ModDate, Creator, Title, Subject, Keywords.

Статьи (article threads). Публикация может включать несколько статей (article threads), каждая из которых, в свою очередь, может содержать несколько фрагментов - bead. Статьи (threads) сохраняются в массиве как значение ключа Threads в Catalog-объекте. Каждая статья и ее фрагменты представляют собой объекты dictionary. Атрибуты статьи: F (определяет первый фрагмент), I (содержит информацию о статье, подобен Info dictionary). К атрибутам фрагмента относят: T (ссылка на статью), V (ссылка на предыдущий фрагмент), N (следующий фрагмент), P (страница, на которой размещается фрагмент), R (прямоугольник положения фрагмента на странице).

Формы (Acrobat Forms). Формы в Acrobat состоят из полей. Основные свойства полей: тип, имя, значение. Свойства формы PDF-документа сохраняются в AcroForm dictionary, на который ссылается ключ объекта Catalog - AcroForm. Его атрибут Fields (array) - массив, состоящий из ссылок на корневые поля. Свойства полей могут располагаться непосредственно в dictionary поля либо наследоваться, так как поля могут иметь иерархическую структуру. Атрибут поля FT (name) определяет тип поля. Названия типов полей в формате: Btn - кнопка; Tx - текст; Ch - поле; V - значение, его формат зависит от типа поля, т.е. от первого атрибута; DV - значение поля по умолчанию; Ft - набор различных характеристик поля (Read Only, Required и т.п.); Kids, Parents - атрибуты, определяющие иерархические отношения между полями. Kids организован в виде массива, каждый элемент которого является соответствующей ссылкой. Формы Acrobat используют комментарии для представления полей и управления действиями пользователя. Эти комментарии имеют подтип Widget. Для оптимизации атрибуты поля объединяются в один dictionary с атрибутами Widget. Поле поэтому может быть комментарием, на который ссылается Annots - ключ к какой-либо странице.

Текстовые и поля выбора могут содержать «переменный» текст, т. е. текст, сохраненный в атрибутах поля и появляющийся при выводе поля на экран. Следующие атрибуты определяют появление такого текста. Атрибут DR - ресурсы (Resources dictionary). Как минимум, он должен содержать ресурс типа шрифта. Атрибут DA характеризует свойства текста, появляющегося по умолчанию. String содержит последовательность операторов, определяющих свойства текста: цвет, кегль (размер) и т.д. Атрибут Q задает режим выравнивания.

Аудиоинформация. Звук представлен как stream-объект, который состоит из объектов типа dictionary. Его атрибуты: R (скорость воспроизведения), C (количество звуковых каналов), B (количество битов на канал), Е (формат звука), CO (тип сжатия звука, этот атрибут может быть пропущен). Многоканальные несжатые звуковые фрагменты сохраняются в формате чередования (в порядке 1, 2), для двухканального стереозвука (1 - левый канал, 2 - правый). Для проигрывания звука из другого файла атрибут F должен содержать имя звукового файла.

Спецификация файла (File specification). Этот тип объекта определяет место расположения файла на диске. Не зависит от операционной системы. Стандартный формат для простой спецификации файла делит строку на компоненты символом (/). Этот символ используется как общий разделитель, который заменяется соответствующим разделителем при создании системно-зависимого имени файла. Известны спецификации файла для различных платформ.

Другой вид описания спецификации файла - directory (полная спецификация). Directory содержит ключ, определяющий платформу F или ключ FS (file system). Три ключа определяют имена файлов для соответствующих платформ: Mac, Dos, Unix.

Шрифт (Font). Шрифт представлен в PDF, форматPDF-формате как объект типа dictionary, определяющий тип, имя, кодировку и другую информацию.

PDF определяет следующие типы шрифтов.

  1. Type 1. К его атрибутам относят:

    • Base Font - имя в языке описания полос PostScript, определяющее базовый шрифт;

    • FirstChar, LastChar - определяет код первого и последнего символов в массиве Widths;

    • Widths - массив ширины (LastChar - FirstChar + 1);

    • Encoding (dictionary) - определяет кодировку символов (в противном случае используется кодировка по умолчанию: MacRomanEncoding, MacExpert Encoding, WinAnsiEncoding);

    • FontDescriptor - определяет размеры и ширину символа.

  2. Type 3 - известен как пользовательский шрифт и имеет следующие атрибуты:

    • CharProcs - ключ-имя символа, значение которого связано с ключом в stream-объекте, который прорисовывает шрифт;

    • FontBox - прямоугольник, ограничивающий область символа (знакоместо);

    • Resources - список поименованных ресурсов для прорисовки шрифта.

Известны также шрифты: TrueType, Type 0, CIDFont Type 0, CIDFont Type 2.

Любой шрифт включает атрибут Name. Большинство шрифтов определяют также ширину символов в шрифте (смещение между началом текущего и следующего символа).

Внешние объекты - External Objects (XObjects). XObjects - поименованные ресурсы. PDF поддерживает три типа таких объектов: Images, Forms и PostScript language fragments, которые используют подтип Image. Цветные изображения могут иметь один компонент цвета (значение индексированного цвета), три компонента (RGB, CalRGB или Lab) или четыре базовых цвета аддитивной цветовой модели CMYK. Image XObject - это объект stream. Stream dictionary должен включать все стандартные ключи потоков, а также несколько дополнительных: Name (имя ресурса), Width, Height (ширина и высота изображения), BitsPerComponent (количество битов на каждый цвет), Interpolate (сглаживание) и др.

Form XObjects - это описание любого текста, графики или простых изображений, которые могут многократно воспроизводиться на различных страницах или в разных местах одной страницы. Представлено в виде stream. Специфические атрибуты: Bbox (Rectangle) - определяет границы формы, Resources - список ресурсов, таких, как текст или изображения, требующиеся для этой формы, XUID - уникальный идентификатор, позволяющий кешировать форму для прорисовки ее в другом месте.

Страничные описания (Page Descriptions). В PDF страничное описание является последовательностью графических объектов. Эти объекты создают маркеры marks, которые прилагаются к текущей странице.

Существует четыре типа таких объектов:

  • path object - произвольные кривые (контуры), включает операторы, определяющие наличие заливки, сглаживания и т.д.;

  • text object содержит одну или более текстовых строк, которые могут быть размещены в любом месте страницы;

  • image object состоит из набора изображений.

  • External Objects (XObject) - объекты, определенные вне потока.

Страничное описание PDF не обязательно «замкнуто». Оно часто ссылается на ресурсы, такие, как шрифт, заливка, форма или изображение, не находящиеся на данной странице, а располагающиеся в другом месте файла.

Графическое состояние (Graphics state). Визуализация графического объекта определяется такими параметрами, как толщина линии, шрифт и др. Они являются частью graphics state. Хотя содержание graphics state подобно таким же состояниям в PostScript, есть некоторые отличия. В PDF graphics state разделено на четыре группы параметров: для текста, цвета, основных операций маркировки и собственно графики. Graphics state расширено для разграничения параметров заливки и штриховки.

Special Graphics State содержит параметры, которые применяются ко всем типам графических объектов. PDF обеспечивает создание graphics state stack для сохранения и восстановления состояний (оператор q).

К Special Graphics State параметрам относятся:

  • Clipping path - ограничивает регион, в котором может быть применена закраска;

  • Current point - все рисование на странице осуществляется с помощью этого параметра (по аналогии с рисованием на бумаге такой параметр можно назвать «местом расположения» пера, используемого для рисования);

  • Special Graphics State operators: q - сохранение текущего состояния в стеке состояний, Q - восстановление графического состояния из стека, concat - модифицирует CTM (Current Transformations Matrix).

Перечислим некоторые из параметров General Graphics state в PDF.

  • Flatness - устанавливает максимальное разрешенное расстояние между точной кривой и ее приближением с помощью сегментов-линий (оператор setflat устанавливает данный параметр);

  • Line cap style - стиль конца линии;

  • Line dash pattern - стиль линии (штриховка и ее параметры);

  • Line join style - стиль соединения линий;

  • Line width - ширина линии;

  • Halftone - параметр полутонов.

Контуры (Path). Используются для представления линий, кривых и областей. Сегментами могут быть прямые линии или кривые (кривые Безье). Операторы: MoveTo, LineTo - добавляют линию к контуру, CurveTo - добавляет кривую к контуру, closepath - «закрывает» контур и добавляет линию из текущей точки к началу контура, fill - заполняет контур и др.

Состояние текста (Text state). Включает те графические параметры, которые влияют только на текст:

  • Tc - расстояние между символами (смещение между началом одного и другого символа);

  • Tw - расстояние между «началами» слов;

  • Th - ширина символов (в процентах от нормальной);

  • Tl - вертикальное расстояние между смежными строками текста;

  • T fs - размер шрифта;

  • T f - шрифт.

PDF text object состоит из операторов, которые определяют символьные строки, перемещения текущей точки и «текстовые состояния».

Text string operators - эти операторы прорисовывают текст на странице. Хотя можно передавать индивидуальные символы текстовым операторам, поиск текста выполняется значительно лучше, если текст группируется по параграфам. Основные операторы: Tj show - выводит текстовую строку, используя параметры из texts state. TJ - выводит текст со смещениями.

PDF, форматФормат PDF используется как основа представления данных при создании электронных изданий с помощью технологий Adobe Systems в среде программного пакета Adobe Acrobat, программный пакетAdobe Acrobat.

RTF, формат Формат RTF (Rich Text Format) был определен фирмой MicrosoftMicrosoft как стандартный формат для обмена текстовыми документами. Данный формат не является стандартом, однако поддерживается фирмой Microsoft и разработчиками программных приложений, ориентированных на программно-информационную совместимость с операционной системой WindowsWindows и ее приложения. Так, например, в Windows начиная с версии 2.0 этот формат введен в качестве Clipboard-формата, благодаря чему возможен обмен данными между различными прикладными программами. Кроме того, формат RTF поддерживается текстовыми редакторами WordWord для Macintosh начиная с версии 3.0 и Word для PC начиная с версии 4.0 для DOS и с версии 2.0 для Windows. В настоящий момент практически любая программа, работающая с текстом, поддерживает этот формат.

В обобщенном виде структура формата представлена на рис. 3.7.


Рис. 3.7. Структура формата RTF

В состав заголовка файла входят идентификатор RTF-файла, команда выбора гарнитуры, команда выбора шрифта по умолчанию и таблица доступных шрифтов, таблица цветов (RGB) и таблица стилей.

В теле файла размещаются данные публикации в виде двоичных кодов ASCII. В формате RTF используются только символы, представимые стандартом ASCII, а также MAC- и PC-символьного набора. Кроме текста, файл в RTF-формате содержит команды управления, которые также реализованы с использованием этого стандарта.

Иногда формат RTF называют языком разметки текста. Это, видимо, связано с тем, что формат содержит операторы, управляющие слова и символы, другие элементы описания размещения текста и графики.

Команды управления разделяются на управляющие слова (control words) и управляющие символы (control symbols).

Управляющее слово представляет собой последовательность символов с разделителем (delimiter) в конце:

\набор_символов <разделитель>

Перед управляющим словом вводится обратная косая черта «\» (backslash). В качестве разделителей могут использоваться следующие символы:

  • пробел (space), причем этот символ относится к управляющему слову;

  • цифра или знак «-» (в этом случае параметр завершается разделителем - пробелом или другими символами, кроме цифр и букв);

  • все символы, отличные от цифр и букв (эти символы не относятся к управляющему слову).

В формате RTF для задания управляющей последовательности символов используются буквы от «А» до «Z» и от «а» до «z», а также цифры от 0 до 9. Национальные символы к управляющей информации не относятся.

В качестве управляющих символов используются отдельные буквы. Перед каждым управляющим символом вводится обратная косая черта «\»:

\управляющий_символ

В настоящее время определены только некоторые из этих символов. Поэтому при чтении неизвестные символы могут быть пропущены.

В формате RTF существует возможность объединять отдельные последовательности в группы при помощи скобок:

{ - начало группы

} - конец группы

Такие группы создаются, например, при описании сносок, колонтитулов и т.п. Если символы «\», «{« или «}» размещаются внутри обычного текста, то перед ними ставится обратная косая черта:

\\;

\{;

\}.

Это позволяет программе, читающей RTF-последовательность, распознать, что символ не следует интерпретировать как управляющий.

В формате RTF используются также символьные коды для управления печатью.

В формате RTF, форматRTF имеются управляющие слова специального назначения. К ним можно отнести:

\chpgn - управляющее слово change page number выводит текущий номер страницы;

\chftn - данная последовательность (change footnote) активизирует автоматическую нумерацию сносок;

\chdate - с помощью управляющего слова change date выводится текущая дата;

\chtime - с помощью change time выводится текущее время;

\chatn - ссылка на примечание (текст следует в группе);

\chftnsep - свидетельствует об изменении линии, отделяющей сноски от текста;

\: - последовательность обозначает подпункт индекса;

\~ - группа символов задает жесткий (неразрываемый) пробел между двумя словами, т.е. в этой позиции предложение не может быть разделено при переносе на следующую строку;

\- - символы обозначают мягкий перенос (nonrequired hyphen);

\_ - символы обозначают неразрываемый перенос (nonbreaking hyphen), на месте которого слово не может быть разделено;

\page - данная последовательность задает переход на новую страницу;

\line - эта последовательность вызывает переход на новую строку в тексте;

\раr - с помощью данной последовательности в тексте отмечается конец абзаца. Последовательность \раr может заменяться последовательностью \10 или \13. При этом \10 соответствует ASCII-символу с кодом 10 (carriage return);

\sect - эта последовательность обозначает конец текстового фрагмента или текстового абзаца.

С помощью управляющих слов можно производить основную настройку программы чтения формата RTF. Эти управляющие слова могут встречаться только в начале документа или в начале группы. Все операторы вместе с параметрами должны быть заключены в скобки, например:

{\rtf0\pc...}

К основным операторам формата можно отнести:

\rtf <параметр> - данный оператор задает метку начала файла. В качестве параметра программа, при помощи которой создается файл, может указывать номер версии, например:

{\rtf0...}

Метка должна стоять в начале файла. После этого оператора могут следовать другие операторы или закрывающая скобка.

Установка вида кодировки для сохраняемого текста осуществляется с помощью операторов, представленных в табл. 3.2.

Таблица 3.2

Оператор Значение
\ansi Текст хранится в стандартном ASCII-формате. Этот формат используется, например, в Windows
\mac Текст хранится в кодировке Macintosh
\pc Для вывода текста используется кодировка символов
\pca IBM-PCIBM-PC Code Page 850 (модель PS/2)

Для передачи текстов между различными системами используется оператор \ansi.

Оператор \colortbl в WindowsWindows-приложениях и других программах применяется для определения палитры используемых цветов. Чаще всего палитра состоит из 16 различных цветов, получаемых путем комбинации базовых цветов - RGB (красного, зеленого и синего). Команда \colortbl позволяет изменить отдельные определения в палитре. Для каждого цвета в таблице указывается величина красной, зеленой и синей составляющей. Каждый цвет описывается тремя параметрами:

\red000 - красный;

\green000 - зеленый;

\blue000 - синий.

Вместо 000 указывается величина интенсивности цвета в диапазоне от 0 до 255. Например, в таблице, состоящей из 16 цветов, должны быть заново определены цвета 0-й и 2-й. Для переопределения цветов может быть задана последовательность:

{\colortbl\red128\green64\blue128\;;\red0\green64\blue128;}

Определение цвета завершается точкой с запятой. Поскольку первый цвет остается без изменений, в последовательности два символа «;» расположены один за другим. Последовательность завершается закрывающей скобкой.

Оператор \cfn определяет цвет фона (при стандартной настройке n=0).

Оператор \cbn определяет цвет символа (при стандартной настройке n=0).

Оператор \fonttbl используется для построения таблицы шрифтов и соотносит имя шрифта (группы шрифтов) с номером шрифта. При определении шрифта можно использовать операторы, представленные в табл. 3.3.

Таблица 3.3

Оператор

Значение

\fnil Имя группы шрифтов неизвестно. При выводе должен использоваться стандартный шрифт
\froman Должны использоваться шрифты группы Roman (например, Times Roman)
\fswiss Этот оператор предписывает использование шрифтов из группы Swiss (Helvetica, Swiss и т.д.)
\fmodern Могут использоваться шрифты Pica, Elite и Courier
\fscript Используются курсивные шрифты группы Script
\fdecor При указании этого оператора шрифты должны выбираться из группыDecor (Old English и т.д.)
\ftech Выбор группы шрифтов с техническими и математическими символами (Symbol и т.д.)

Команда для создания группы шрифтов может состоять из таких операторов:

{\fonttbl\f0\fnil default;}

{\fl\froman roman h;}

{\f2\fswiss helvetica;}

После ключевого слова \fonttbl следует первый номер шрифта \f0. Далее идет определение группы шрифтов. Здесь после номера 0 указано \fnil, т.е. имя группы неизвестно. Следующий параметр обозначает имя выбираемого шрифта (например, roman h). Указание default говорит считывающей программе о том, что следует использовать стандартный шрифт. После имени шрифта стоит точка с запятой. В приведенном примере определены только шрифты с номерами 1 и 2. Вся последовательность может быть объединена фигурными скобками в группу.

Таблица шрифтов должна быть заполнена значениями до того, как встретится оператор \stylesheet или текст. Стандартный шрифт вводится оператором \deffn.

Оператор \stylesheet определяет шрифт абзаца, т.е. размер, начертание и имя гарнитуры, а также способ выравнивания текста абзаца. При этом используются два ключевых оператора, описание которых представлено в табл. 3.4.

Таблица 3.4

Оператор

Значение

\sbasedon000 Вместо символов 000 указывается номер вида шрифта, который используется в качестве текущего
\snext000 Назначает номер следующего вида шрифта (style), который станет текущим

Оператор может иметь, например, следующий вид:

{\stylesheet\s0\f3\fs20\qj Normal;}

{\sl\f3\fs30\b\qc Heading Level 3;}

Шрифты нумеруются числами от 0 до n (\s0...). В первой строке стилю абзаца 0 (\s0) предписывается имя Normal. Вывод текста выполняется шрифтом 3 (\f3), размером 10 пунктов (\fs20). Параметр \qj говорит о том, что надпись должна выравниваться по формату. Вторая строка определяет стиль шрифта 1, который получает имя Heading Level 3. Шрифт имеет размер 15 пунктов, жирное начертание (\b = bold) и при выводе надпись центрируется (\qc).

Оператор \pict используется при описании рисунка в формате битовой карты (bitmap). Операторы, приведенные в табл. 5, содержат описание рисунка в виде шестнадцатеричных значений. Эти операторы могут быть выборочно использованы для определения геометрии рисунка или его формата.

Для задания параметров колонтитулов в состав формата введены следующие операторы:

  • Оператор \header определяет верхний колонтитул текущего фрагмента текста и вводится в начале текста.

  • Оператор \headerl определяет верхний колонтитул четной страницы (left hand header), на которой колонтитул выводится с выравниванием влево.

  • Оператор \headerr устанавливает верхний колонтитул нечетной страницы, на которой колонтитул выводится с выравниванием вправо (right hand header).

  • Оператор \headerf устанавливает верхний колонтитул первой страницы (first page header).

  • Оператор \footer устанавливает нижний колонтитул текущего фрагмента и должен указываться перед началом текста.

  • Оператор \footerl устанавливает нижний колонтитул четной страницы (left hand footer), на которой колонтитул выводится с выравниванием влево.

  • Оператор \footerr устанавливает нижний колонтитул нечетной страницы, на которой он выводится с левосторонним выравниванием (right hand footer).

  • Оператор \footerf устанавливает нижний колонтитул первой страницы (first page footer).

Группа операторов \xe описывает стиль нумерации страниц (табл. 3.6).

Таблица 3.6

Оператор Описание
\bxe Для номеров страниц задается жирное начертание (bold)
\ixe Для номеров страниц задается курсивное начертание (italic)
\txe text Вместо номера страницы используется текст
\rxe bookmark Генерация номеров страниц для области, содержащей закладку (bookmark)

В составе формата предусмотрены операторы форматирования документа (document formatting). Их действие распространяется на весь текстовой материал.

Команда \paperw000 задает ширину листа в twips (один twip равен 1/20 пункта или 1/1440 дюйма). Значение ширины указывается вместо 000. Если команда отсутствует, то ширина листа устанавливается равной 12240 twips.

Команда \рареrh000 задает высоту листа в twips. Значение высоты указывается вместо 000. Если команда отсутствует, то высота листа устанавливается равной 15840 twips.

С помощью команды \margl000 можно устанавливать ширину левого поля при печати. Стандартная ширина поля равна 1800 twips.

С помощью команды \margr000 можно установить ширину правого поля при печати. Стандартная ширина поля равна 1800 twips.

Оператор \margt000 служит для установки ширины верхнего поля (margin top) при печати. Стандартная ширина поля равна 1440 twips.

С помощью команды \ margb000 устанавливается ширина нижнего поля (margin bottom) при печати. Стандартная ширина поля равна 1440 twips.

Оператор \facingp (facing page) определяет внешний вид страницы. Он устанавливает, например, печатается колонтитул на четных или на нечетных страницах. Если за оператором следует параметр 0, то вывод подавляется.

С помощью оператора \gutter000 можно установить ширину поля подшивки (gutter) внутри facing page.

Команда \deftab000 определяет величину табулятора. Стандартное значение составляет 72 twips.

Предусмотрена работа со сносками.

Если в документе указан оператор \endnotes, то тексты сносок размещаются в конце фрагмента.

По умолчанию тексты сносок выводятся в конце страницы (footnotes bottom justified). Оператор \ftobj позволяет переключиться с установки, заданной оператором \endnotes, на стандартную установку.

При использовании оператора \ftntj сноски выводятся в тексте (footnotes top justified).

При указании этого оператора \ftnrestart нумерация сносок на каждой странице начинается с 1. Параметр 0 отключает эту установку.

Оператор \ftnsep определяет разделитель, который отделяет сноски от текста.

Оператор\ftnsepc определяет разделитель, который отделяет сноски, переходящие на следующую страницу, от текста.

Команда \ftncn задает отметку для следующей сноски.

Команда \enddoc определяет сноску в конце документа.

Команда\landscape используется для задания альбомной ориентации (landscape) издания. При указании параметра 0 восстанавливается книжная ориентация.

В составе формата RTF имеются операторы для задания начертания и способа выделения символов при создании редакторских примечаний, форматирования секции (section formatting); команды задания расстояния между строками; операторы нумерации строк; операторы задания атрибутов колонтитулов; команды выравнивания; операторы форматирования абзаца (paragraph formatting); установки параметров отступа первой строки абзаца (first line indent); операторы задания атрибутов рамки вокруг абзаца; операторы форматирования таблиц и др.

Набор операторов рассматриваемого формата ориентирован на описание сложного текстового материала, включающего иллюстрации, таблицы, диаграммы и другие элементы печатных изданий.

Формат RTF применяется для представления электронных изданий, созданных в среде MS Office, и приложений операционной системы WindowsWindows. Обычно он выполняет функции обменного формата.

© Центр дистанционного образования МГУП