Зареалье: феномены Сети и технологии работы с ними
Цикл # IQ     Опыт 13-4-2

Сбор vs. синтез информации
- Чем отличается ум от мудрости? - спросили ученики Ходжу Насреддина.
- Ум подобен мечу в руках воина, - ответил Ходжа, - а мудрость - его умению вести бой.

В этом выпуске мы подведем итоги эксперименту по определению оптимального соотношения между сбором и синтезом информации. Сам же эксперимент, напомню, служил иллюстрацией к использованию программы PFlite, которая по опытным замерам вычисляет параметры производственной функции Кобба-Дугласа.  

Итак, постановка задачи 13-го выпуска сводилась к тому, чтобы применить среды визуальных вычислений (здесь Advanced Grapher и PFlite) для оптимального распределения ресурсов. 

В результате трудов тяжких (;0) были получены следующие данные:

Тема обзора

V

S

N

P

R  
(с V/без V)

K (мин/доля)

L (мин/доля)

Эссе "Компьютерная эзотерика"

8203

0,1

1

0,1

82/0,01

6/0,03

228/0,97

Обучающие среды

27184

0,3

0,3

0,5

1223/0,04

34/0,15

192/0,85

Смысловые срезы

18610

0,7

0,7

0,7

9119/0,34

210/0,54

180/0,46

Аксиологическая коммуникация

63464

0,7

0,3

0,5

6664/0,11

165/0,82

35/0,18

Словарь-справочник по Data Mining

23714

1

0,1

0,1

237/0,01

115/0,85

21/0,15

Чтобы эта таблица не выглядела совсем тарабарщиной, напомню её показатели, а потом растолкую смысл результатов.

K - оценка основного капитала или потенциала (в данном эксперименте она рассчитывалась как время на сбор информации, мин.)

L - оценка оборотного капитала или живого труда (здесь - время на синтез и оформление информации, мин.)

R - количественная характеристика произведенной продукции, в данном случае, объема и качества текста обзора.

R = V . S . N . P , где:

V - объем текста (число знаков)

S - основательность, т.е. включенность в существующую систему знаний по теме
(от 0 до 1; для сборника цитат S = 1)

N - новизна, т.е. прирост относительно банальной трактовки темы
(от 0 до 1; для эссе N = 1)

P - полезность, т.е. перспективность изложенных в тексте идей или технологий для осмысления и решения обсуждаемых проблем
(от 0 до 1; в норме P = 0,5 и отклонения от этого значения возникают только при явных потерях или находках)
 

Эти данные были введены в PFlite, и она тут же выдала значения степенных показателей функции Кобба-Дугласа, которые задают оптимальную пропорцию распределения ресурсов (здесь - времени) между сбором информации и синтезом собственной.

α = 0,88

β = 0,12

Иными словами, получилось, что мне для работ такого рода следует ориентироваться на такую пропорцию: примерно 90% времени тратить на сбор новой информации и 10% на её переосмысление или синтез собственной.

Не берусь судить, что бы вы почувствовали на моем месте, но должен признаться, что меня это несколько покоробило. Не ожидал я такой низкой доли собственных размышлизмов в оптимальной структуре работ.

Тут я вспомнил две народные мудрости - "Мал золотник, да дорог" и "Тише едешь - дальше будешь" - и повторил расчет, исключив в показателе качества объем обзора (V приравнял 1) и заменив абсолютные значения трудозатрат на относительные (т.е. доли). При таком раскладе получилось: 

α = 0,59

β = 0,41

Итак, если размер обзора не имеет значения (согласитесь, что погоня за раздуванием текста только вредит делу) и время работы неограниченно, то на сбор информации лучше выделять 60% времени, а на синтез, соответственно, 40%.

+ + +

Для тех, кто захочет повторить этот эксперимент, несколько замечаний.

Оказалось, что PFlite не умеет работать с маленькими числами (или с запятыми в десятичных дробях - я не стал разбираться). Поэтому при втором расчете значения показателей пришлось умножить на 100.

Хронометраж при написании опытных обзоров выявил одну неожиданную вещь в структуре работ. Мало того, что написание перемежается с другими делами и как бы пропитывает расписание дня. Оказалось, что активная работа с информацией - только надстройка над обширным фундаментом подготовительных работ. Например, чтобы пролистать книгу и выписать цитату, нужно сначала поехать в библиотеку, заказать эту книгу и ждать, пока её вам доставят. Или, с другой стороны, прежде чем вписать в обзор ваш размышлизм, его ещё нужно придумать. Конечно, при написании он додумывается и дополняется, но сама-то идея может прийти в голову в транспорте, во сне или в других самых неожиданных ситуациях. Так вот, эти подготовительные затраты времени в расчет не принимались. Предполагалось, что вы уже имеете собранную базу знаний по теме и уже заранее продумали в общих чертах структуру обзора и собственную позицию по отношению к теме. И оптимизация относилась по сути к выбору жанра - писать ли эссе, или справочник цитат, или нечто промежуточное.

Мои базы знаний представляли собой электронные тексты, написанные мной прежде или скачанные из Сети. Если я заимствовал собственный текст, то в копилку синтеза добавлялось расчетное время его написания по опытным образом установленному нормативу 35 зн./мин.

Для работы с такими базами - мешаниной файлов, собранных в директории по областям знаний - я использовал поисковую систему AVSearch (ну, до чего ж хороша! - всем рекомендую и ещё воспою её в одном из будущих выпусков рассылки. А пока дам адресок, откуда её можно скачать (821 Кб): http://www.avtlab.ru/avsearch.htm )

До новых встреч!
Юлий Феодоритов
mailto:feod@narod.ru

* * *

Мы закончили тему визуальных вычислений. На очереди - "смысловые срезы" - усилители интеллекта, позволяющие работать с выборками абзацев или предложений по ключевым словам.

 Источники   

Теории, концепции, прогнозы

Феномены Сети и компьютинга

На главную

Рейтинг@Mail.ru

Сайт создан в системе uCoz