Технологии обработки текстовой информации

Задачи главы

  • 1. Дать общее представление о содержании операции по работе с текстовой информацией.
  • 2. Познакомиться с представителями класса программных средств "текстовые редакторы" и "текстовые процессоры".
  • 3. Познакомиться с информационными технологиями текстового процессора MS Word.

Текстовые редакторы

Текст представляет собой наиболее простой, универсальный и надежный способ фиксации результатов умственной деятельности человека. Опыт и знания об окружающем мире человек часто оформляет и накапливает в виде текстовых документов. Способ компьютерного представления и обработки текста является одной из важнейших задач в области компьютерных технологий. Существует большое разнообразие программных средств, поддерживающих работу с текстом:

■ текстовые редакторы (для работы с текстами);

■ текстовые процессоры (для работы с текстовыми документами);

■ издательские системы (подготовка текстовых документов к публикации и типографской печати);

■ программы-переводчики, трансляторы, словари (автоматический перевод текста документа);

■ программы-шифровальщики (криптографирование содержимого текстового документа);

■ программы контекстного поиска информации в текстовых документах; и др.

Текстовый редактор (Text Editor) – компьютерная программа, предназначенная для создания, редактирования, просмотра текста любого назначения (исходный код программы, простые документы) на экране, вывода на печать.

Существует большое число текстовых редакторов, различающихся по функциональным возможностям обработки текста, наличию средств автоматизации обработки (средств программирования, макрокоманд), типу пользовательского интерфейса, видам выполняемых работ. Можно выделить трех представителей данного класса программных продуктов: редакторы программных кодов, редакторы текстовых файлов, редакторы текстовых документов.

Создание исходных кодов программ на языке программирования выполняется с помощью так называемого встроенного в систему программирования (Visual Basic, Turbo Pascal, С и др.) текстового редактора. Редактор программных кодов имеет ограниченные возможности по форматированию текста программ, но обеспечивает удобство набора ключевых фраз программного кода, синтаксическую проверку правильности употребления языковых конструкций, нумерацию строк программного кода и др. Исходный код программы сохраняется в формате текстового файла с кодировкой ANSII.

Простейшие текстовые редакторы встроены в ОС (Windows, Linux и др.), оболочки ОС (Norton Commander, PC Shell, Total Commander и т.п.), а также в некоторые пакеты прикладных программ функционального назначения. Например, программа "1C: Предприятие" позволяет создавать текстовые файлы, не выходя из программы.

Программа типа "Текстовый редактор" обеспечивает базовые технологии форматирования и редактирования текста, сохранение текстовых документов в виде файлов. Форматирование текста означает применение форматов на уровне символов (шрифтов), абзацев (положение текста на печатной странице, отступы и межстрочные расстояния и др.), разделов печатного документа и т.п. Редактирование текста связано с преобразованиями текста, обеспечивающими изменение содержимого, структурирование текстового документа (выделение глав, параграфов и т.п.), вставку примечаний, сносок, объектов (рисунков, диаграмм, звуковых и видеокомментариев), составление оглавления и списков таблиц, формул, рисунков и т.п.

Как правило, простые текстовые редакторы не поддерживают разнообразных технологий работы с текстом (реализуют лишь простейшие приемы автоматизации ввода и редактирования текста) и графикой, интерфейсов с другими программными системами. Типичным примером простейшего текстового редактора является программа "Блокнот", входящая в состав ОС Windows. Программа "Блокнот" используется для просмотра и редактирования текстовых документов (файлов с расширением. TXT) или веб-страниц (файлы с расширением. НТМ). Текстовые файлы в программе "Блокнот" могут сохраняться в кодировках Unicode, ANSII, UTF-8 или Юникод Big Endian (для возможности работы с текстовыми документами, созданными на ЭВМ Macintosh). По умолчанию текстовые документы сохраняются в кодировке ANSI; по требованию может быть выбрана иная кодировка (в частности, для кодировки Unicode допускается использование управляющих символов, например, выбор направления письма и расположения текста для языков типа арабский или иврит).

Текстовый редактор "Блокнот" предоставляет пользовательский интерфейс в виде Главного меню, содержащего режимы работы:

■ Файл – поддержка операций работы с файлами (создание, открытие, сохранение, печать, настройка параметров печатной страницы);

■ Правка – поддержка операций работы с фрагментами текста (вырезать, копировать, вставить, удалить), поиск/ замена фрагмента текста, вставка специального поля (дата и время);

■ Формат – форматирование шрифта текста всего документа, перенос по словам (в пределах ширины окна документа);

■ Вид – вывод строки состояния;

■ Справка – по программе "Блокнот".

Новый текстовый документ создается командой Файл, Создать. Для сохранения документа выполняется команда Файл, Сохранить как с указанием местоположения (диск, папка), имени и кодировки (ANSI, Unicode, UTF-8, Unicode Big Endian). Для подготовки текста всего документа выбирается шрифт – команда Формат, Шрифт: название шрифтовой гарнитуры, размер и стиль начертания (обычный, курсив, жирный, жирный курсив), устанавливается ширина окна документа. Для автоматического переноса текста по ширине окна выполняется команда Формат, Перенос по словам (в противном случае выполняется ввод "длинных" строк текста, которые не видны в основном окне документа и требуется скроллинг текста). Если текст состоит из абзацев, их разделяют нажатием клавиши Enter.

Для редактирования документа выполняются команды:

■ удаление выделенного фрагмента текста – Правка, Вырезать;

■ копирование выделенного фрагмента текста – Правка, Копировать;

■ вставка скопированного фрагмента текста – Правка, Вставить.

Часто требуется выполнить поиск заданного образца текста – команда Правка, Найти. Указывается направление поиска (вверх, вниз), регистр для символов поискового образца. Команда Правка, Найти далее позволяет продолжить поиск по всему текстовому документу. Команда Правка, Заменить обеспечивает замену поискового образца текстового документа на указанный образец, определяет число замен (один раз или всех вхождений образца поиска).

Для подготовки текстового документа к печати выполняется команда Файл, Параметры страницы, выбирается размер бумаги для печатной копии документа, способ подачи бумаги в принтер. Печатная страница может иметь книжную (печать вдоль узкой стороны листа) или альбомную (печать вдоль широкой стороны листа) ориентацию, определенный размер полей (слева, справа, сверху и снизу). Кроме того, для большинства печатных копий применяется оформление колонтитулов (постоянной информации). Для колонтитулов можно использовать спецсимволы, обеспечивающие вставку для печати: &Ф – имени файла; &Д – даты,

&В – времени, &С – номера страницы, &Л (Ц, ∏) –способа выравнивания (влево, по центру, вправо) колонтитула.

Ниже в табл. 11.1 приведено сравнение различных текстовых редакторов по ряду функциональных возможностей[1].

Комментарии к табл. 11.1. Коды текстовых редакторов

1 – Aditor 3.10

2 – Akelpad 3.4.4

3 – Boxer Text Editor 12.0.1

4 – Bred 3.0.3

5 – ConTEXT 0.98.5

6 – EmEditor Pro 6.0

7 – FoxEditor 0.7.5

8 – gedit 2.20.4

9 – GridinSoft Notepad 3.3.1

10 – Kate 2.5.5

11 – Kedit 1.3

12 – Notepad++4.6

13 – PSPad 4.5.3

14 – RJ TextEd 4.10

15 – Silver Editor 1.5.1

16 – SkimEdit 4.0

17– TEA 12.4.2

Тип ОС определяет совместимость программы текстового редактора с ОС ЭВМ. НЕХ-редактор – шестнадцатеричный редактор для двоичных данных в шестнадцатеричном представлении. Применяется для работы с носителями информации (редактор секторов или дисков). RTF (Rich Text Format) – межплатформенный формат хранения размеченных текстовых документов, предложенный

Таблица 11 .1. Сравнение текстовых редакторов

Признак для сравнения текстовых редакторов

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

ОС

Windows

+

+

+

+

+

+

+

-

+

-

-

+

+

+

+

+

+

Mac OSX

-

-

-

-

-

-

-

-

-

-

-

-

-

-

+

-

-

Linux

-

-

-

-

-

-

-

+

-

+

+

-

-

-

+

-

+

Интерфейс

Русский язык интерфейса

+

+

-

+

+

-

+

+

+

+

+

+

+

+

-

+

+

Панель инструментов

+

-

+

+

+

+

+

+

+

+

+

+

+

+

+

+

-

Открытие нескольких документов в одном окне

+

+

+

-

+

+

+

+

+

+

-

+

+

+

-

-

+

Работа с проектами

-

-

+

-

+

+

+

-

-

+

-

+

+

+

-

-

-

Кодировка символов

Windows-1251

+

+

+

+

+

+

+

+

+

+

-

+

+

+

+

+

+

DOS-866

+

+

+

+

+

+

+

+

+

+

-

-

+

+

-

+

+

KOI8-R

+

+

-

+

-

+

+

+

+

+

-

-

+

+

-

+

+

Поддержка Unicode

-

+

-

+

-

+

-

+

+

+

+

+

+

+

+

+

+

НЕХ-редактор

-

-

+

-

-

-

-

-

+

-

-

+

+

+

-

-

-

Признак для сравнения текстовых редакторов

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

Редактирование и форматирование текста

Поддержка редактирования RTF

Предварительный просмотр в диалоге открытия документа

-

+

+

+

-

-

+

-

+

-

-

-

-

-

-

-

-

Подсветка синтаксиса

+

-

+

-

+

+

+

+

-1-

+

-

+

+

+

-

+

+

Быстрая вставка даты и времени

-

-

+

+

+

+

+

+

+

+

+

+

+

+

-

+

+

Быстрая вставка HTML-тегов

+

-

+

-

-

+

+

-

+

+

-

+

+

+

-

-

+

Быстрая вставка произвольных строк

-

-

+

-

+

+

-

+

+

+

-

+

+

+

-

-

+

Поиск по мере набора текста

-

-

+

-

+

-

+

+

+

-

-

+

+

-

-

-

-

Замена текста на основе регулярных выражений

+

-

+

-

+

+

+

+

+

+

-

+

+

+

-

-

-

Предварительный просмотр документа перед печатью

+

-

+

-

+

+

+

+

+

+

-

-

+

+

-

-

-

Сохранение экранной сессии

-

-

+

-

-

+

-

-

-

+

-

+

+

+

-

-

+

Признак для сравнения текстовых редакторов

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

Редактирование и форматирование текста

Запись и воспроизведение макросов

-

-

+

-

+

+

-

+

+

-

-

+

+

+

-

-

-

Закладки внутри текста

+

-

+

-

+

+

-

+

+

+

-

+

+

+

-

-

+

Автоматическая коррекция текста

-

-

+

-

-

-

-

-

+

+

-

+

+

-

-

-

-

Все заглавные буквы

+

+

+

-

+

+

+

+

+

+

-

+

+

+

-

+

+

Все буквы строчные

+

+

+

-

+

+

+

+

+

+

-

+

+

+

-

+

+

Все слова с большой буквы

+

+

+

-

-

+

-

+

-

-

-

+

+

+

-

+

-

Инвертирование регистра

+

+

+

-

+

-

-

+

-1-

-

-

+

+

-

-

+

-

Как в предложениях

-

+

+

-

-

-

-

-

+

+

-

+

+

-

-

-

+

Транслитерация

+

Шифрование документов

+

-

-

-

-

-

+

-

-

-

-

-

-

+

-

-

-

Исправление раскладки клавиатуры

-

-

-

-

-

-

+

-

-

-

-

-

-

-

-

-

-

Проверка орфографии на русском языке

-

-

-

-

-

-

+

+

+

+

+

-

+

+

-

-

-

Сравнение текстов

-

-

+

-

+

+

-

-

-

-

-

-

+

-

-

-

-

Файлы

Цветная печать с учетом подсветки синтаксиса

Файловый навигатор

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

FTP-клиент

-

-

+

-

-

-

-

-

-

+

-

-

+

+

-

-

-

Microsoft. Транслитерация – конверсия систем письма: каждый графический элемент одной системы письма заменяется графическим элементом другой системы письма. Необходимо обеспечить однозначность, простоту и обратимость преобразования. FTP (File Transfer Protocol – протокол передачи файлов) – поддержка протокола передачи файлов в компьютерных сетях.

  • [1] Режим доступа: ixbt.corn/soft/texteditors-l.shtml.
 
< Пред   СОДЕРЖАНИЕ     След >