Зареалье: феномены Сети и технологии
работы с ними
Цикл # IQ Опыт 13-4-2
Сбор vs. синтез информации
- Чем отличается ум от мудрости? - спросили ученики Ходжу Насреддина.
- Ум подобен мечу в руках воина, - ответил Ходжа, - а мудрость - его умению вести бой.
В этом выпуске мы подведем итоги эксперименту по определению оптимального соотношения между сбором и синтезом информации. Сам же эксперимент, напомню, служил иллюстрацией к использованию программы PFlite, которая по опытным замерам вычисляет параметры производственной функции Кобба-Дугласа.
Итак, постановка задачи 13-го выпуска сводилась к тому, чтобы применить среды визуальных вычислений (здесь Advanced Grapher и PFlite) для оптимального распределения ресурсов.
В результате трудов тяжких (;0) были получены следующие данные:
Тема
обзора |
V |
S |
N |
P |
R |
K
(мин/доля) |
L
(мин/доля) |
Эссе "Компьютерная
эзотерика" |
8203 |
0,1 |
1 |
0,1 |
82/0,01 |
6/0,03 |
228/0,97 |
Обучающие среды |
27184 |
0,3 |
0,3 |
0,5 |
1223 |
34/0,15 |
192/0,85 |
Смысловые срезы |
18610 |
0,7 |
0,7 |
0,7 |
9119 |
210/0,54 |
180/0,46 |
Аксиологическая
коммуникация |
63464 |
0,7 |
0,3 |
0,5 |
6664 |
165/0,82 |
35/0,18 |
Словарь-справочник по Data Mining |
23714 |
1 |
0,1 |
0,1 |
237 |
115/0,85 |
21/0,15 |
Чтобы эта таблица не выглядела совсем тарабарщиной, напомню её показатели, а потом растолкую смысл результатов.
K - оценка основного капитала или потенциала (в данном эксперименте она рассчитывалась как время на сбор информации, мин.)
L - оценка оборотного капитала или живого труда (здесь - время на синтез и оформление информации, мин.)
R - количественная характеристика произведенной продукции, в данном случае, объема и качества текста обзора.
R = V . S . N . P , где:
V - объем текста (число знаков)
S - основательность, т.е.
включенность в существующую систему знаний
по теме
(от 0 до 1; для сборника цитат S = 1)
N - новизна, т.е. прирост
относительно банальной трактовки темы
(от 0 до 1; для эссе N = 1)
P - полезность, т.е. перспективность
изложенных в тексте идей или технологий для осмысления
и решения обсуждаемых проблем
(от 0 до 1; в норме P = 0,5 и отклонения от этого
значения возникают только при явных
потерях или находках)
Эти данные были введены в PFlite, и она тут же выдала значения степенных показателей функции Кобба-Дугласа, которые задают оптимальную пропорцию распределения ресурсов (здесь - времени) между сбором информации и синтезом собственной.
α = 0,88
β = 0,12
Иными словами, получилось, что мне для работ такого рода следует ориентироваться на такую пропорцию: примерно 90% времени тратить на сбор новой информации и 10% на её переосмысление или синтез собственной.
Не берусь судить, что бы вы почувствовали на моем месте, но должен признаться, что меня это несколько покоробило. Не ожидал я такой низкой доли собственных размышлизмов в оптимальной структуре работ.
Тут я вспомнил две народные мудрости - "Мал золотник, да дорог" и "Тише едешь - дальше будешь" - и повторил расчет, исключив в показателе качества объем обзора (V приравнял 1) и заменив абсолютные значения трудозатрат на относительные (т.е. доли). При таком раскладе получилось:
α = 0,59
β = 0,41
Итак, если размер обзора не имеет значения (согласитесь, что погоня за раздуванием текста только вредит делу) и время работы неограниченно, то на сбор информации лучше выделять 60% времени, а на синтез, соответственно, 40%.
+ + +
Для тех, кто захочет повторить этот эксперимент, несколько замечаний.
Оказалось, что PFlite не умеет работать с маленькими числами (или с запятыми в десятичных дробях - я не стал разбираться). Поэтому при втором расчете значения показателей пришлось умножить на 100.
Хронометраж при написании опытных обзоров выявил одну неожиданную вещь в структуре работ. Мало того, что написание перемежается с другими делами и как бы пропитывает расписание дня. Оказалось, что активная работа с информацией - только надстройка над обширным фундаментом подготовительных работ. Например, чтобы пролистать книгу и выписать цитату, нужно сначала поехать в библиотеку, заказать эту книгу и ждать, пока её вам доставят. Или, с другой стороны, прежде чем вписать в обзор ваш размышлизм, его ещё нужно придумать. Конечно, при написании он додумывается и дополняется, но сама-то идея может прийти в голову в транспорте, во сне или в других самых неожиданных ситуациях. Так вот, эти подготовительные затраты времени в расчет не принимались. Предполагалось, что вы уже имеете собранную базу знаний по теме и уже заранее продумали в общих чертах структуру обзора и собственную позицию по отношению к теме. И оптимизация относилась по сути к выбору жанра - писать ли эссе, или справочник цитат, или нечто промежуточное.
Мои базы знаний представляли собой электронные тексты, написанные мной прежде или скачанные из Сети. Если я заимствовал собственный текст, то в копилку синтеза добавлялось расчетное время его написания по опытным образом установленному нормативу 35 зн./мин.
Для работы с такими базами - мешаниной файлов, собранных в директории по областям знаний - я использовал поисковую систему AVSearch (ну, до чего ж хороша! - всем рекомендую и ещё воспою её в одном из будущих выпусков рассылки. А пока дам адресок, откуда её можно скачать (821 Кб): http://www.avtlab.ru/avsearch.htm )
До
новых встреч!
Юлий Феодоритов
mailto:feod@narod.ru
* * *
Мы закончили тему визуальных вычислений. На очереди - "смысловые срезы" - усилители интеллекта, позволяющие работать с выборками абзацев или предложений по ключевым словам.