Зареалье: феномены Сети и технологии работы с ними
Цикл # IQ     Выпуск 14

Смысловые срезы

Работа с электронными текстами открывает небывалые возможности в копировании, редактировании и тиражировании текстов. Но самыми интересными являются смысловые преобразования, открывающие необычные комбинации обычного, - иными словами, позволяющие взглянуть на содержание под новым углом зрения.

В этом обзоре мы коснемся самого распространенного из этих преобразований – смысловых срезов, т.е. выборок абзацев по ключевым словам. Именно с такими выборками мы имеем дело, когда просматриваем результаты работы поисковых систем – при блуждании по Интернету, при раскопках в собственных архивах или при работе с громоздкими текстами.

Некоторые из поисковых систем, заслуживающих быть включенными в ваш персональный набор интеллектуальных утилит, будут представлены в этом обзоре. Но начнем мы с другого – а именно, с выяснения природы смысловых срезов и их соотношения с текстом (или архивом текстов), из которого они были получены.

1.  Смысловой срез как набор ссылок

Это самая распространенная трактовка результатов работы поисковых систем. Собственно, для этого последние и создавались. В результате поиска вы получаете список ссылок на источники, в тексте которых встречается заданное ключевое слово, причем у   каждой ссылки имеется для справки фрагмент текста, где это слово фигурирует.

Предполагается, что по списку вы пройдете по заинтересовавшим вас ссылкам и уже там получите то, что искали, начиная поиск.

В данном случае смысловой срез выступает в роли интерфейса для выхода на реальные тексты. А чтение его как самостоятельного текста так же нелепо и редко встречается, как и сплошное чтение, к примеру, словарей или энциклопедий.

2. Смысловой срез как сборник цитат

В этой трактовке абзацы или предложения, прилагаемые к ссылкам в качестве справки, воспринимаются как имеющие самостоятельное значение, т.е. как цитаты.  Вы можете пройти по ссылке, чтобы "обчитать" текст вокруг цитаты и лучше понять её контекстный смысл, но это не является необходимым требованием. Чаще всего читатель ограничивается самой цитатой без дополнительной контекстной интерпретации. 

Во-первых, так проще. Например, цитатники Мао Цзэдуна были рассчитаны на самую широкую аудиторию и несли слово и мысль "великого кормчего" в массы без каких-либо экивоков на статьи и книги, из которых они были заимствованы. Так же устроены и сборники цитат "Крылатые слова" и т.п.

Во-вторых, для такого понимания смысловых срезов есть достаточно убедительные основания.  Авторы, владеющие афористичным стилем, вкрапляют в свои тексты предложения и абзацы, точно и емко выражающие ключевые мысли произведения, так что цитата приобретает законченность афоризма или пословицы, вечной носительницы житейской мудрости.

3. Смысловой срез как коллекция определений

Наиболее интересна вот эта, третья трактовка, в полной мере оправдывающая термин "смысловой срез".  В ней вы берете примеры употребления ключевого слова как прецеденты контекстных смыслов, в которых это слово употребляется.

Особенно значимы такие коллекции определений для слов, являющихся терминами, в которых автор выражает суть своего замысла. Здесь смысловые срезы позволяют вам лучше разобраться в терминологии автора, а также как бы спроецировать авторский замысел на экран заданного вами ключевого слова.

Если же изучаемый вами текст носит не абстрактно-теоретический, а конкретно-описательный характер, то коллекция определений позволит вам лучше обрисовать портреты героев этого описания, использованные автором детали и т.п., собрав на один экран все проявления того или иного объекта.  

В лингвистике такие модификации текстов называют красивым термином КОНКОРДАНСЫ и получают немалые гранты от Фонда Сороса, например, на составление конкордансов великих писателей и поэтов. Созданы конкордансы к стихам Пушкина ( http://gladkeeh.boom.ru/Books/Concordance.htm ), всему наследию Достоевского ( http://www.karelia.ru/~Dostoevsky/dostconc/about.htm ), поэмам Мандельштама и даже русскому изданию Библии ( http://www.krugosvet.ru/articles/82/1008264/1008264a11.htm ).

Между тем, если слегка отступить от научных формализмов, то конкордансы вы непринужденно можете составить сами и насладиться созерцанием новых граней любимых книг. Для этого есть множество бесплатных (!) программ.

Итак:

Поиск текстов в Сети

http://search.da.ru/

Комплексные смысловые срезы Сети по основным поисковым системам - те же результаты, что и у выбранных поисковиков, но:

  1. Без баннеров, рекламы и выпадающих окон
  2. Все поисковики опрашиваются по одному клику
  3. Все результаты показываются на одной странице общим списком

В общем, быстро, просто и эффективно.

Поиск текстов на вашем компьютере

http://www.avtlab.ru/avsearch.htm

На сайте разработчиков можно скачать AVSearch (821 Кб) – лучшую персональную искалку.

Программа предназначена для поиска файлов на дисках по фрагментам текста в любой кодировке: Windows, OEM 866 (DOS), KOI-8R, ISO 8859-5, UNICODE. Имеется возможность поиска в различных архивах (около 20 форматов). Встроенные средства позволяют просматривать найденные документы в текстовом виде или в виде HEX-таблицы. Автоматическое выделение (подсветка) искомых слов и навигация между ними, сохранение списка файлов для дальнейшей обработки, доступность всех файловых операций (удаление, переименование, копирование), выбор для поиска различных папок (в том числе находящихся на разных дисках), "фильтрация" файлов (по размеру, типу, дате изменения) и многое другое...
Дополнительно содержит программу для поиска файлов в архивах (по имени) с возможностью последующего их извлечения.

Подборка цитат из громоздких текстов

http://www.umopit.ru/FilText.htm

На сайте УмоПит можно скачать "Фильтратор текстов" (168 Кб)

Как пишет автор программы Александр Глазков: "Фильтратор является текстовым скульптором, работающим по Вашему заказу. Он принимает от Вас заказ в виде одного или нескольких интересующих Вас слов или фрагментов слов, оценивает информативную структуру исходного текста и отсекает всё ненужное. Если текст имеет строковую структуру (как телефонный справочник), то получите только строки, содержащие заказанные слова. При абзацной структуре - получите только интересующие Вас абзацы. А заказанное будет выделено цветом".

(к сожалению, эта программа работает только с текстами в формате txt  и rtf (здесь ей далеко до AVSearch, понимающей любые форматы).

* * *

В подвал выпуска, чтобы не грузить уважаемых подписчиков излишними абстракциями, я помещаю выжимку из теоретических работ, посвященных механизмам понимания текстов.

Это просто уму непостижимо, сколько понаписано про способы создания и понимания текстов, а если взять шире, про механизмы мышления. Сколько здесь разных школ, точек зрения, концепций и т.п.!!! Причем каждая суть не произвольный домысел создателей очередной теории, а достаточно обоснованное построение, опирающееся на экспериментальные психологические, семиотические, культурологические и т.п. исследования. Заметим также, что все философские и религиозные учения так или иначе описывали процесс мышления, так что и их тоже следовало бы включить в обзор теоретических работ по обсуждаемой теме.

Заняться дотошным перечислением и сопоставлением всех упомянутых теорий – это загубить дело и уморить читателя обзора. И мы по этому пути (соблазнительному для диссертантов и авторов монографий) не пойдем. Есть другое решение, на мой взгляд, изящное.

Ключом к свертке универсума теорий мышления является понимание того, что само мышление является чрезвычайно гибким объектом, способным перевоплощаться в те модели, которыми его пытаются представить. Отсюда и экспериментальные подтверждения: участники экспериментов приспосабливаются к тем моделям, которые экспериментаторы пытаются на них проверять…

Эту особенность мышления как объекта исследования отмечали многие.  Например, психика описывается как многомерная субстанция – живая, дышащая, текучая плазма, которая движется в пространстве образов сознания. Это пространство задается силовыми полями его узлов, которые представляют внешний мир, внутренний мир, культуру и язык (Василюк Ф.Е., 1993; Залевская А.А., 2001).

Если признать гибкость мышления за отправной пункт теоретизирования, то из него можно вывести ключевой критерий в оценке теорий мышления.  Итак, важна не истинность какой-либо теории (они все истинны, ибо дают достоверную версию механизмов работы того, что является механизмом только виртуально), а то, насколько эта теория оснащена технологически (что она МОЖЕТ), под какие задачи она заточена и каковы границы её применимости.

Как правило, теоретики весьма негативно относятся к декомпозиции текстов на цитаты, награждая такие результаты эпитетами от "хаотической кучи" до "эпифеноменального понимания" и "царства фиктивной конкретности".

Однако с таким односторонним пониманием смысловых срезов хотелось бы поспорить. Спрашивается, как быть с архаичными текстами или текстами на малоинтересную вам тему, когда задача читателя состоит в поиске нужных ему фрагментов и сведений, а не в расшифровке авторского замысла (и это даже в поэзии – когда в устаревшей и скучной поэме вдруг находится сверкающее и вечное четверостишие)? Или вот ещё: как быть с текстами, доверху залитыми "водой", которой автор наращивает свою солидность и гонорар? Наконец, как быть с гипертекстами и таблоидами – современными формами организации текста, ориентированных именно на избирательное, "порхающее" восприятие?

Обратимся в связи с этим к теории гипертекста (Ванневар Буш, Тед Нельсон, Дуглас Энгельбарт).

Текст воспринимается читателем в виде линии строчек очень непродолжительное время - при первом восприятии. Постоянно возвращаясь к прочитанному, сопоставляя разные участки текста, переставляя их при конспектировании, мы деформируем первоначальную линейность текстового пространства.

Следовательно, процесс чтения, если представить его буквально, представляет собой разрезание текста на части, удвоение (копирование) этих частей, склеивание их в ином порядке, повторное разделение на другие части и т.д.

Этот процесс представляет собой переход от визуального пространства текста к пространству семантическому - в котором особо выделены важнейшие фрагменты текста, близкие по смыслу сведены вместе, а противоположные удалены. При этом соблюдаются и общие культурные каноны организации семантического пространства.

Например, совмещение высокого и далекого - чем выше, тем безграничнее простор, чем ниже, тем теснее. Предполагается, что движение возможно только наверху, и оппозиция "верх-низ" приобретает смысл не только антитезы "движение - неподвижность", но и "добро - зло". Смерть - прекращение движения - есть опускание вниз.

Кроме того, тема текста и способ ее осмысления могут меняться в ходе изложения, в силу чего семантическое пространство претерпевает превращения.

Так, во многих текстах автор подводит читателя к переоценке ценностей. В каком-то месте текста, обычно специально обозначенном, ключевые слова обретают иной смысл, нежели тот, который придавался им изначально.

Наконец, для текстов характерно замыкание смысловой и лексической ткани в кольцо. Текст как бы намекает читателю - прочти меня еще раз.

Если спроецировать семантическое пространство на текст, то в нем будет высвечена его неоднородность: ярко будут отмечены важнейшие фрагменты, на них рубинами будут гореть ключевые слова (места наибольшей деформации линейной формы), видны будут места разрыва смысловой ткани, ее превращений и инверсий, обнаружатся трансцендентные смысловые тяжи к текстуально удаленным, но по смыслу близким фрагментам. Мы сможем увидеть и такие феномены, как отражение всего текста в его маленьком фрагменте или замыкание начала и конца в кольцо.

Все эти превращения отражают виртуальную семантику текста, как бы вырастающую из него при прочтении и понимании.

Моделями такой семантики служат вербальные сети - множества ключевых слов, связанных ассоциациями и весами значимости в системе отношений. А организация текстов по принципам вербальных сетей получила название "гипертекст".

Вот основные свойства ключевых слов:

1. Они не зависят от структуры текста и могут находиться где угодно.

2. Как собственно ключевые слова данного текста они обретают смысл в нем и только в нем.

3. Они соотносятся друг с другом и имеют веса. Так, не может в тексте быть менее 2 ключевых слов - иначе он теряет внутреннюю структуру.

4. Вес ключевого слова выше, если оно входит в важнейшие фрагменты текста. Вес максимален, если это слово само по себе является важнейшим фрагментом.

5. Максимальным весом обладает слово, по отношению к которому определяются веса других слов.

6. Во множестве ключевых слов наибольшие веса имеют те, которые максимально по смыслу удалены друг от друга.

7. То ключевое слово имеет больший вес, которое встречается в качественно различных по смыслу фрагментах текста.

Конечная цель установления ключевых слов - в установлении смыслового ядра текста, тогда как слова с малым весом относятся к периферии - они менее важны для понимания смысла текста и их выделение более субъективно.

Текст есть не что иное, как сообщение от автора к читателю. Когда мы воссоздаем семантическое пространство текста - мы пытаемся понять авторский замысел, смысл его послания нам. И этот смысл ОДИН (если имеются подтексты, то смыслов несколько, но все равно, они - плоды единого авторского замысла).

Совсем иное дело - интерпретации текста. Любой текст может иметь бесконечное число интерпретаций, как бесконечно число контекстов, в которые данный текст включается элементом и обретает контекстуальный смысл.

Конечно, интерпретация базируется на понимании - но уже не обязательно всего текста - часто достаточно понимания отдельных его фрагментов. При интерпретации читатель берет из текста те смыслы и под такими ракурсами, которые полезны ему с точки зрения его цели.

Таковы вкратце основные положения теории гипертекста – как видим, они вполне допускают существование смысловых срезов и дают вполне ясные ориентиры в том, как ими пользоваться:

·       при постижении авторского замысла мы ими можем нащупывать смысловое ядро текста и уточнять понимание авторского языка;

·       при интерпретации они позволяют быстро найти те фрагменты текста, которые важны для решаемой нами задачи.

В завершение темы - ссылка на любопытный пример графического отображения смысловой структуры текста. Его я нашел в статье Романа Матвиенко "Книга на одной странице" в январском номере журнала "Магия ПК" (с. 54-55).  Это программа TextArc, позволяющая строить конкорданс в виде круга гиперссылок. Описание - здесь: http://textarc.org/ (сорри, но этот апплет может работать только с текстами на английском языке) 

* * *

Вопрос недели предваряет переход к новой теме - программным средам оценочного мышления.

Как вы относитесь к людям, которые берут на себя смелость оценивать вещи, ситуации и поступки?

1. Я сам такой (такая).

2. Не судите и не судимы будете.

3. Вот наглецы. На всем же развешаны ценники.

4. Иное (в этом случае укажите - что именно).

Проставьте номера выбранных вами ответов в теме письма и пошлите автору.

До новых встреч!
Юлий Феодоритов
mailto:feod@narod.ru

 Источники   

Теории, концепции, прогнозы

Феномены Сети и компьютинга

На главную

Рейтинг@Mail.ru

Сайт создан в системе uCoz