Николай Петрович Морозов "Информатика и ИТ. Нейросети."

Эта книга во многом опирается на материал, изложенный в моих книгах «Виды информации и ИТ ее обработки», «Информатика и ИТ». В ней изложены теоретические основы информатики, рассмотрены основные виды информационных технологий, представлены приемы работы с программными продуктами.Электронный формат книги позволяет повысить качество и эффективность самостоятельной работы студентов. Учебник может быть также использован в системах открытого и дополнительного образования.

date_range Год издания :

foundation Издательство :Издательские решения

person Автор :

workspaces ISBN :9785006274075

child_care Возрастное ограничение : 12

update Дата обновления : 12.04.2024


Например, рассматривая снимок Луны, нужно сначала выявить наличие более светлых и более темных участков снимка. Затем суметь понять, как они отражают особенности рельефа, что соответствует низменным областям, а что – гористым (для этого необходимо иметь некоторые предварительные знания о Луне, о свойствах световых лучей, об особенностях их отражения от разных поверхностях, об особенностях изменения свойств фотопленки под действием света и пр.).

Другой пример. Пусть на клочке бумаги нанесены штрихи, образующие такую картину: maximum. Во-первых, нужно понять, что эти штрихи изображают последовательность букв, во вторых, надо понять, что это за буквы, какое слово, какого языка они изображают, в-третьих – каков смысл этого слова. Если предварительно известно, что это обрывок дореволюционного текста на русском языке, то это слово можно прочесть как «тахитит», т.е. слово, не имеющее смысла. Однако, если еще известно, что текст математический, то это слово можно прочесть как имеющее вполне определенный смысл слово «максимум».

Вышеупомянутые «неоднородности в свойствах материального носителя данных», смыслом которых являются некие сведения об источнике, образуют «знаки».

Информация (сведения) об источнике фиксируется в данных в виде совокупности знаков[1 - Знаком называется материальный объект, который для некоторого интерпретатора выступает в качестве представителя какого-то другого предмета.]. Знаком может быть буква, слово, пиктограмма, рисунок и пр.

Информацию, циркулирующую в человеческом обществе, в настоящее время часто называют «семантической». В «Философии информации» А.В.Соколов приводит определение:

«Семантическая информация – смысловое сообщение, выраженное знаками (одним знаком или их организованной последовательностью). Под смыслом сообщения понимаются знания, умения, эмоции, волевые побуждения, фантазии, являющиеся продуктами индивидуальной психической деятельности, которые могут быть поняты другими людьми». Организованную совокупность знаков принято называть текстом.

Таким образом, информация, фиксируемая на первом этапе коммуникационного процесса, выражается текстом. И, следовательно, данные (т.е. те характеристики объекта В, которые отображают сведения об объекте А), образуют некоторый текст.

Под расширенно толкуемое понятие текста подпадают и обычные письменные и печатные тексты, и результаты регистрации показаний прибора, и картина художника, и запись симфонического концерта и пр.

На втором этапе коммуникационного процесса текст, отображаемый данными, играет роль входной информации, которая далее обрабатывается совместно с другой информацией (знаниями), известной воспринимающей системе.

Совокупность сведений (знаний), которыми располагает получатель (человек или система) называется тезаурус. Тезаурус обычно включает некое представление воспринимающей системы о той предметной области, к которой принадлежит источник данных, и о самом источнике данных.

В процессе обработки входной информации, сопоставления ее с тезаурусом получателя происходит понимание информации (выявление ее смысла) и выделение в ней полезной информации, т.е. сведений, новых для получателя, еще не включенных в его тезаурус. Пополнение тезауруса получателя вновь выявленными сведениями и является результатом восприятия информации.

Для понимания полученной информации получатель (называемый также пользователем) должен изначально обладать определенным запасом знаний о некоторой предметной области.

Количество семантической информации, извлекаемой пользователем из поступающих сообщений, зависит от степени подготовленности его тезауруса для восприятия такой информации. Полное незнание предмета не позволяет извлечь полезную информацию из принятого сообщения об этом предмете. По мере роста знаний пользователя о предмете растет количество полезной информации, извлекаемой из сообщения.

В зависимости от соотношений между смысловым содержанием информации S и тезаурусом пользователя Sp изменяется количество семантической информации Ic, воспринимаемой пользователем и включаемой им в свой тезаурус. Характер такой зависимости показан на рис.1.1. Этот рисунок демонстрирует следующее:

– при Sp = 0 пользователь не имеет знаний о предметной области, поэтому не понимает поступившее сообщение S и количество полученной им семантической информации равно нулю (Ic = 0);

– если тезаурус пользователя Sp, т.е. он уже «все знает» о предметной области, то очередное сообщение не содержит для него ничего нового, и Ic = 0;

– вначале по мере роста объема тезауруса Sp возрастает количество информации, понимаемой пользователем, и, следовательно, растет количество извлекаемой полезной информации Ic, пополняющей тезаурус пользователя;

– максимальное количество семантической информации пользователя получает тогда, когда объем тезауруса Sp позволяет ему понимать всю поступающую информацию (это значение Sp обозначено как Sp opt);

– при дальнейшем увеличении Sp количество понятой информации уже не увеличивается, но все больше информации из поступающего сообщения оказывается пользователю известной; поэтому количество Ic начинает уменьшаться.

Рис. 1.1. Зависимость Ic (количества семантической информации,

воспринимаемой пользователем) от его тезауруса Sp.

Из вышесказанного следует, что количество новых знаний, получаемых пользователем информации, является величиной относительной. Одно и то же сообщение может иметь определенный смысл для компетентного пользователя и быть бессмысленным для пользователя некомпетентного.

Так, например, источником информации может быть китайский врач, написавший книгу (данные) об особенностях китайской медицины. Открыть эту книгу может каждый, прочесть – только тот, кто умеет читать по-китайски. Такой читатель сумеет воспринять текст, составленный автором. Но, чтобы понять и воспринять этот текст необходимо иметь знания по медицине вообще, и китайской медицине в частности. Эти знания отсутствуют в исходном тексте, но автор, когда писал свой текст, имел их в виду, рассчитывал на то, что читатель тоже будет в той или иной мере иметь эти знания. Получить из книги информацию, адекватную той, которую вложил автор, может лишь соответствующим образом подготовленная, владеющая необходимыми знаниями воспринимающая система (конкретный читатель).

Содержимое тезауруса пользователя в начале процесса информационной коммуникации называют также априорной информацией, а семантическую информацию, полученную пользователем в результате коммуникации – актуальной информацией. Т.е. актуальная информация – это сведения, расширяющие состав априорной информации.

Таким образом, в процессе информационной коммуникации выделяются три основных компонента:

исходная информация – отражаемые сведения об источнике, т.е. совокупность тех значений характеристик источника, которые повлияли на изменение данных;

данные – представление переданных сведений, т.е. совокупность характеристик промежуточного материального носителя, изменившихся в результате фиксации передаваемых сведений;

воспринятая информация – актуальные сведения, полученные воспринимающей системой в результате совместной обработки сведений, зафиксированных в данных, со сведениями, знаниями, априорно доступными воспринимающей системе.

Как видим, информация в этом процессе предстает в двух видах, разделенных во времени: исходная и воспринятая информация. Эта особенность информации называется ее дуализмом. Третий компонент – данные выступает как канал передачи информации во времени.

Информация, т.е. сведения о распределении материи и энергии, об изменениях в процессах – суть знания человека об окружающем мире, в том числе о человеческой деятельности. Информация – это знание, которое существует не только для данного человека, но и для других людей.

Способом, обеспечивающим доступность знаний, информации разным людям, является представление и хранение информации в виде данных на материальном носителе. Таким образом, вся информация, употребляемая человечеством в его деятельности, воплощающая интеллектуальный и духовный потенциалы человечества, хранится в форме данных. Отсюда следует, что и третий компонент информационной коммуникации (данные) может рассматриваться как вид представления информации – хранимая информация (см. схему на рис.1.2.).

Рис. 1.2. Информационная коммуникация

Свойства информации. Любая информация обладает рядом свойств, которые в совокупности определяют степень ее соответствия потребностям пользователя (качество информации). В научной литературе описывается немало разнообразных свойств информации, так как каждая научная дисциплина рассматривает те свойства, которые ей наиболее важны.

Рассмотрим свойства информации с точки зрения основных этапов коммуникационного процесса.

– Свойства исходной информации.

В зависимости от способа восприятия исходная информация подразделяется на визуальную, аудиальную, тактильную, обонятельную, вкусовую; в соответствии с видами воспринимающих ее органов чувств -зрения, слуха, ощущения, запаха, вкуса.

– Свойства хранимой информации (данных).

Данные фиксируются в некоторой материальной запоминающей среде посредством изменения ее физических, химических или механических свойств.

По видам носителей данные подразделяются, во-первых, по материалу носителя. Издавна известны, такие носители как камень (наскальные рисунки, каменные плиты), глиняные таблички, пергамент, папирус, береста и другие. Затем появились следующие носители: бумага, пластмасса, фотоматериалы, магнитные и оптические материалы и другие.

Кроме того носители делятся на традиционные и машиночитаемые. Под традиционными понимаются: бумага, холст, пластмасса (грампластинка), магнитная лента (аудио и видеокассета), фотографические материалы (фотопленка, фото-пластина, фотоотпечаток, микро-носитель) и т. п.

К машиночитаемым носителям относятся: дискеты (гибкие магнитные диски), жёсткие магнитные и компактные (оптические, магнитооптические и иные) диски, флеш -карты и другие носители информации, предназначенные для использования в компьютерных устройствах, комплексах, системах и сетях.

По форме представления данных на материальном носителе данные подразделяются на:

– изобразительные (или графические): наскальные рисунки, картины, схемы, фотографии и пр.

– текстовые, изображающие речь с помощью символов (букв) в виде лексем естественного языка,

– числовые, в виде комбинаций цифр и математических знаков,

– звуковые, отображающие записанную с помощью звукозаписывающих устройств аудиальную информацию,

– музыкальные тексты – разновидность звуковой информации, записанной с использованием специальных символов (нот),

– видеоинформация – способ хранения «живых», динамичных картин окружающего мира в виде видеозаписи.

– Фиксация информации в виде данных

Взаимодействие различных объектов в реальности происходит постоянно, и поэтому постоянно реализуются процессы фиксации следов этих взаимодействий на материальных носителях. Эти процессы могут происходить непреднамеренно, целенаправленно или сознательно.

Непреднамеренный процесс фиксации информации. В реальном мире обычно процесс взаимодействия объектов «не имеет цели» нести информацию, «не знает», что он связан с отражением (оценкой разнообразия) и с информацией. Он просто происходит. Результаты изменения характеристик материального носителя «не знают», что они данные и отражают информацию. Они просто возникают в процессе взаимодействия. Однако может найтись некий получатель, который захочет извлечь информацию из результатов этого взаимодействия. Тогда эти результаты станут играть роль данных на втором этапе процесса информационной коммуникации.

Целенаправленная фиксация информации происходит в системах, в которых одни процессы используют результаты других процессов. Например, в системе «родители – дети» в одном организме происходит порождение молекул ДНК, содержащих генетическую информацию, которая предназначена для использования другими организмами. Или: результаты протекания некоторого наблюдаемого процесса регистрируются специальными устройствами для последующей обработки наблюдений. Обработка результатов опирается на некоторую модель процесса, которую учитывали разработчики системы обработки. При этом происходит объективная потеря информации, обусловленная характеристиками аппаратуры, ее точности и пр.

Процесс отражения результатов духовной или мыслительной деятельности человека предусматривает сознательное порождение одним человеком текстов, предназначенных для последующего их восприятия другим человеком. В этом случае возможно искажение смысла. Как сказано Ф. Тютчевым: «Мысль изреченная есть ложь». Это искажение определяется возможностями автора («регистрирующего устройства»): его мастерством «изречения» и умением переносить мысль в данные.

Как видим, в любом случае зафиксированная информация несколько отличается от исходной, передает свойства отображаемой реальности с искажением. И чем больше шагов преобразования происходит на пути от отображаемой реальности к данным, тем больше оказывается степень искажения. Но при этом процесс фиксации информации характеризуется довольно высокой степенью объективности – он зависит от условий фиксации и «технических характеристик» процесса фиксации, но не зависит от чьего-нибудь мнения или сознания. Даже если человек выдает заведомо лживое сообщение (дезинформацию), запись этого сообщения есть объективное отображение того, что произнесено (а определение истинности сказанного – это уже другой вопрос).

– Свойства воспринятой информации.

Результаты восприятия информации всегда субъективны, определяются возможностями получателя, его знаниями, прагматическими целями, с которыми он воспринимает информацию, и т. п. Одни и те же данные могут быть использованы различными людьми (и даже одним и тем же человеком в разные моменты времени) по-разному; информация, заложенная в молекуле ДНК, может по-разному использоваться здоровым и больным организмом; одни и те же данные в памяти компьютера по-разному используются разными программами и т. п. Восприятие непреднамеренно оставленных следов физических процессов заключается в том, что сначала воспринимающей системой создается некая модель источника – принимаются соглашения о правилах соответствия этих следов (данных), характеристикам источника, о том, как эти следы структурируются (каков их синтаксис) и как осмысливаются (какова их семантика); а потом уже происходит непосредственное восприятие и осмысление данных.

Отметим также, что передача исходной информации (создание данных) осуществляется один раз, а использование данных может осуществляться многократно и по-разному.

Свойства информации с точки зрения восприятия подразделяют на две группы: прагматические и атрибутивные.

Прагматические свойства информации – это те свойства, которые характеризуют степень полезности информации для пользователя в его практике. С прагматической точки зрения информация может быть:

– Объективная – существующая вне и независимо от человеческого сознания.

– Актуальная – информация, ценная в данный момент времени.

– Достоверная – информация, полученная без искажений.

– Понятная – информация, выраженная на языке, понятном тому, кому она предназначена.

– Полная – информация, достаточная для принятия правильного решения или понимания.

– Полезная – полезность информации определяется субъектом, получившим информацию в зависимости от объёма возможностей её использования.

Атрибутивные свойства – это те влияющие на восприятие свойства информации, которые отображают особенности информации, связанные с ее хранением в совокупностях данных и в тезаурусах пользователей. Эти свойства следующие:

– Кумулятивность информации – накопление информации; способность к более строгому, обобщенному и компактному восприятию накопленной информации в процессе создания новой информации

– Преемственность информации – способность освоения новой информации с учетом уже накопленной.

– Концентрация информации проявляется в том, что по мере накопления определенных единиц информации они имеют тенденцию к объединению в более информационно-ёмкие формы.

– Эмерджентность информации – проявление в результате совместного рассмотрения элементов информации таких смыслов, которые не наблюдаются ни в одном из элементов, если они рассматриваются отдельно. То есть система больше суммы своих элементов.

– Неассоциативность и некоммутативность информации – любая информация это не арифметическая сумма составляющих её элементов, эти элементы нельзя использовать в другой последовательности. Как говорится, сначала надо думать, а потом делать, но никак не наоборот.

– Старение информации – с течением времени хранимая информация начинает устаревать, утрачивать ценность для пользователя. Абсолютно устаревшая информация – это информация, которая с появлением новой информацией оказалась недостоверной. Относительно устаревшей информацияназывается тогда, когда она может быть дополнена новой информацией.

Структура данных. Как уже говорилось, данные представляют собой результаты отражения, как процессов реального мира, так и результатов осознанной деятельности человека. Происходит это в режиме как непосредственного, так и отложенного общения.

В режиме отложенного общения данные фиксируются на материальном носителе и через некоторое время воспринимаются получателем (пользователем). Выше отмечалось, что при этом воспринимающая система извлекает из сообщения полезную актуальную информацию и расширяет свой тезаурус. Казалось бы, после этого сведения, отраженные в данных, уже не содержат полезной информации, являются бесполезными. Однако, во-первых, эти же сведения могут быть использованы тем же пользователем в других целях, для решения других задач, а, во-вторых, они могут быть полезными другим пользователям. Поэтому возникает необходимость длительного сохранения данных на материальном носителе.

Таким образом, огромное количество информации хранится в виде данных на различных материальных носителях: в книгах, тетрадях, архивных документах, файлах интернета и пр. В этом море информации выделяются большие хранилища данных: библиотеки, архивы, базы данных, информационные фонды.

Для того, чтобы указать, где находится необходимая информация, необходимо назвать соответствующее хранилище. Но, кроме того, нужно указать конкретный элемент данных, содержащий нужную информацию, назвать необходимую «порцию» информации.

В процессе фиксации информации происходит занесение некоторой «порции информации» на какой-то материальный носитель в виде текста, представляющего собой «порцию данных». Будем далее «порцию информации» обозначать термином «сообщение».

При непосредственном общении «порция данных» сразу же поступает в «обработку», т.е. реализуется передача данных в режиме «адресант – адресат». При отложенном общении «порция хранимых данных» поступает к получателю в режиме поиска: «запрос – ответ». По инициативе получателя задается запрос, в соответствии с которым воспринимающая система выдает ответ. Для обеспечения этого процесса необходимо, чтобы воспринимающая система могла найти ту «порцию данных», где зафиксировано нужное сообщение.

Поэтому важнейшими вопросами построения процесса обработки информации (данных) являются вопросы о том, какова структура хранимых данных и как сопоставляются «порция информации» (сообщение) и соответствующая ей «порция данных» (текст).

Структура данных определяется, прежде всего, структурой материального носителя, на котором находятся данные. Материальный носитель представляется как совокупность некоторых «кусков», т.е. материальных объектов с определенными физическими свойствами. В качестве материального объекта может выступать лист бумаги, сброшюрованная пачка листов бумаги, магнитный или оптический диск, кусок холста и др.

Все пространство хранения данных – это совокупность материальных объектов, на которых зафиксированы те или другие данные. Таким образом, основным структурным элементом данных является совокупность данных, расположенных на одном материальном объекте. Такую совокупность обычно связывают с понятием «документ».

Не всякий материальный объект с зафиксированными на нем данными является документом. Например, только что найденный в Великом Новгороде кусочек бересты с текстом не является документом, и станет им тогда, когда будет зафиксировано, где и когда он был найден, а сам кусочек получит учетный номер.

Для того чтобы выбрать объект, идентифицировать, т.е. однозначно обозначить его, нужно знать его характеристики, отличающие его от других объектов. Если выбор осуществляет непосредственно человек, то он может ориентироваться как на «информационные» характеристики объекта (название, автор, год издания, текстовое описание и пр.), так и на характеристики, воспринимаемые чувственно (цвет, форма, размер, вид носителя и пр.). Например: «Дедушкина толстая синяя записная книжка». Если же поиск осуществляется с помощью вспомогательных средств (каталоги, компьютер), то объект можно идентифицировать только «информационно», с помощью таких характеристик как шифр, инвентарный номер, и т. п.

Документ – это идентифицируемый материальныйобъект, содержащий информацию.

Это определение имеет наиболее общий характер. В разных отраслях деятельности человек имеет дело с документами разного вида, к ним применяются различные дополнительные требования. Например, юридически значимые документы должны быть оформлены специальным образом, содержать подписи, печати и т. д. Документом является и паспорт человека, и завещание, и надгробная плита, и книга, и картина художника, и аудиозапись, и файл на магнитном носителе.

Определение документа отражает две разные ипостаси документа, в соответствии с которыми он может быть интересен потребителю: «что это за информационный объект» и «про что он». А именно: иногда интересно иметь сведения о документе как объекте, о его правовом статусе и других характеристиках, в том числе, может быть, и об информации, отражаемой в этом документе. В других случаях потребителя интересует собственно информация о чем-то, в том числе, может быть, сведения о документе (объекте), содержащем эту информацию.

Чаще всего, конечно, документ интересен с точки зрения его информации. Но чтобы найти нужный документ, необходимо найти тот материальный объект, на котором зафиксирована эта информация.

Документ является особым типом объектов. Объект – это нечто, существующее в реальной действительности. Объекты характеризуются какими-то свойствами: цвет, форма, размер, назначение и пр. Объекты отличаются друг от друга разными значениями их свойств. Для того, чтобы обозначить объект, следует назвать отличающие его значения некоторых свойств. Например: марка, год выпуска, цвет, номер регистрации автомобиля; фамилия, должность, табельный номер сотрудника. Значения некоторых свойств однозначно определяют объект (номер регистрации автомобиля или табельный номер сотрудника), значения других свойств позволяют найти несколько объектов (все красные автомобили или все инженеры).

Документы представляют собой особый тип объектов: «Документ – это объект, отличающийся от обычного объекта тем, что он содержит информацию». Поэтому для того, чтобы описать документ, необходимо, во-первых, описать некий материальный объект, а во-вторых, описать содержащуюся на нем информацию. И при поиске документов можно задавать как их свойства, характеризующие объект (год издания книги, название, автор), так и характеристики информации, содержащейся в документе. Например: найти произведения А.С.Пушкина, изданные в 1999 г, в которых говорится о Пугачеве и о заячьем тулупчике.

Операции с данными. Двоичный код. Единицы измерения информации

Все книги на сайте предоставены для ознакомления и защищены авторским правом