Computer Science

Информация


Книга Джеймса Глика «Информация. История. Теория. Поток» в кратком изложении
Писатель и популяризатор науки Джеймс Глик рассказывает о том, как наше отношение к информации изменило саму природу человеческого сознания. Его книга "Информация" — увлекательное и напряженное путешествие по истории информации и связи от языка, на котором "говорили" африканские барабаны, к изобретению алфавитов, от первых попыток кодирования к электронным письмам и блогам, от древних времен к современности. На этом пути его сопровождают Чарльз Бэббидж, Ада Лавлейс, Клод Шеннон и другие великие ученые. "Информация" была признана лучшей научной книгой года по версии Los Angeles Times, получила множество призов и стала международным бестселлером.

Информация и знания

Разминка:Что такое теория информации? (видео 1)KhanAcademyRussian.

Все мы получаем ежесекундно очень много информации из окружающего мира. Часть из них сохраняется в нашей памяти. Это наши знания. Знания - наши представления о самом себе и окружающем нас мире. Знания у всех людей разные. Иными словами знания - это информация, которой владеет человек.

Свои знания человек высказывает в виде утверждений: "Я знаю, что ..." и "Я знаю, как ..."

Примеры: "Я знаю, что Земля круглая", "Я знаю, что в Арктике живут белые медведи", "Я знаю, что столица России - город Москва", "Я знаю, как умножать числа столбиком", "Я знаю, как ездить на велосипеде", "Я знаю, как сварить щи".

Из примеров видно, что знания бывают двух видов:

  1. "Я знаю, как ..." - знание последовательности действий, алгоритма - процедурные знания.
  2. "Я знаю, что ..." - знание фактов, законов и т.п. - декларативные знания.

Информация - понятие более общее. Она не связана только с знаниями конкретного человека. Строгого определения термина не существует. Это простейшее понятие в информатике - такое же, как понятие точки в математике. Под информацией люди понимают некие знания, сообщения, данные.

Носитель информации - то, на чем хранится информация (мозг человека, папирус, береста, бумага, магнитный или оптический диск)

Данные - информация, которая хранится на носителе (зафиксирована).

Если вдуматься, то обнаружим, что информация всегда хранится на каком-либо носителе. А при работе с информацией происходят изменения свойств носителя.

Наука информатика занимается изучением свойств информации и методов работы с ней:

Человек получает информацию при помощи своих органов чувств. И делит по способу получения на 5 видов:

Представляет (сохраняет) информацию в разных формах:

Информация обладает рядом свойств. Свойства отражают отношение человека к полученным им данным:

Чтобы полученные данные превратились в знания необходимо наличие у человека начальных, стартовых знаний. Например, если к нам придет из прошлого Юлий Цезарь и расскажет на языке древних римлян что-то, наши знания не изменятся, мы ничего не поймем на латинском языке. Для восприятия нам нужно знать сам язык римлян.

Знания человека не пополняются в двух противоположных случаях:


Для начинающих

Основные информационные процессы

Ответим на вопрос: что можно делать с информацией? Сначала уточним некоторые термины.

Процесс - действия, продолжающиеся определенный промежуток времени. Например, процесс чтения книги.

При письме в тетради изменяются свойства поверхности бумаги: меняется цвет там, где провели ручкой - процесс; при разговоре меняется плотность воздуха, изменения распространяются в виде звуковых волн - процесс. При хранении информации изменения в носителе человек не производит - нет процесса! Поэтому к информационным процессам относят передачу и обработку информации.

  1. Передача информации- перенос на другой носитель через канал связи(воздух, провода, электромагнитные поле).

ИСТОЧНИК - {кодировщик} ----сообщение---- {ДЕкодировщик}- ПРИЕМНИК

Сигнал — это изменение свойств носителя, которое используется для передачи информации. Например, свойств воздуха.
Сообщение
— это последовательность сигналов.

Кодирующее устройство необходимо для преобразования информации в форму, удобную для передачи (пример - модем при подключении к сети).
Декодирующее
устройство преобразует информацию в форму, понятную получателю (тоже модем :)).

При передаче всегда присутствуют помехи - появляются посторонние сигналы. Один из важнейших способов борьбы с помехами – избыточность информации. Например, при плохой слышимости из-за ветра во время разговора по телефону можно передать Борис Игорь Татьяна для сообщения одного слова бит.

  1. Обработка информации

Краткий итог

Как измерить информацию?

I. Измерение информации: содержательный подход

Как измерить знания у человека? Вспомним определение информации и знаний.

Чтобы узнать что-то, люди задают вопросы. Наименьшую порцию знаний человек получает услышав в ответ "ДА" или "НЕТ". Если вопрос сформулирован правильно, то область незнания (неопределенность знаний) уменьшается в 2 раза. Минимальная порция получила название бит: binary digit - двоичная цифра.

Сообщение, уменьшающее неопределенность знаний в два раза, несет 1 бит информации.

Неопределенность знаний о некотором событии - это количество возможных результатов события.

Пример: игра в отгадывание чисел. Ведущий задумал целое число в интервале от 1 до 8. Нам нужно за наименьшее количество вопросов, на которые можно услышать один из ответов (Да или Нет) отгадать число. Алгоритм должен гарантировать получение результата в любом случае. Закодируем ответ ДА цифрой 1, НЕТ цифрой 0.

Ход игры (от 1 до 8)
Среди каких чисел ищем Вопрос Ответ Бит
1 2 3 4 5 6 7 8 Число > 4 Да 1
5 6 7 8 Число > 6 Нет 0
5 6 Это число = 5 Да 1

Задумано число 5. Получили результат за 3 вопроса. Знания увеличились на 3 бита: 101.

Нетрудно понять, что при 16 числах понадобится 4 вопроса и т.д.

Ход игры (от 1 до 16)
Среди каких чисел ищем Вопрос Ответ Бит
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 Число > 8 Да 1
9 10 11 12 13 14 15 16 Число < 13 Да 1
9 10 11 12 Число > 10 Нет 0
9 10 Число = 10 Нет 0

Задумано число 9. Объем знаний возрос на 4 бита: 1100

Составим таблицу количества возможных вариантов выбора и объема информации, получаемой при решении задачи.

Шпаргалка для некоторых значений
N - количеств вариантов i - количество вопросов (бит) Связь между N и i
2 1 21 = 2
4 2 22 = 4
8 3 23 = 8
16 4 24 = 16
32 5 25 = 32
64 6 26 = 64
128 7 27 = 128
256 8 28 = 256
512 9 29 = 512
1024 10 210 = 1024
N i 2i = N

Пример: после сдачи зачета или выполнения контрольной работы ученик мучается неопределенностью, он не знает, какую оценку получил: "Зачет", "незачет"? "2", "3", "4" или "5"?

Наконец, учитель объявляет результаты, и он получаете одно из двух информационных сообщений: "зачет" или "незачет", а после контрольной работы одно из четырех информационных сообщений: "2", "3", "4" или "5".

Информационное сообщение об оценке:

Пример: на книжном стеллаже восемь полок. Книга может быть поставлена на любую из них. Сколько информации содержит сообщение о том, что книга на 7 полке?

(смотрите таблицу выше).

Количество информации, содержащееся в сообщении о том, что произошло одно из N равновероятных событий, определяется из решения уравнения:
2i = N

Задачи
  1. Сколько информации содержит сообщение о том, что из колоды карт достали король пик? В колоде 32 карты.
    Решение:
    В колоде выпадение любой карты - равновероятное событие.
    N = 32. i - ?
    2i = N
    2i = 32
    25 = 32
    i = 5 бит
  2. Сколько информации содержит сообщение о выпадении грани с числом 3 на шестигранном игральном кубике?
    Решение:
    N = 6. i - ?
    2i = N
    2i = 6
    22 < 6 < 23
    i> 2 и i < 3
    Объем информации может быт дробным числом! Решение таких уравнений изучают в старших класса.
    Здесь приведем готовый ответ:
    i = 2,5849625007211561814537389439478 бит
  3. Сколько информации содержит сообщение о том, что на поле 4х4 клетки одна из клеток закрашена? (Сначала найдите N)
  4. В книге 512 страниц. Сколько информации несет сообщение о том, что закладка лежит на 153 странице?
  5. Вычислите мощность алфавита N, с помощью которого записано сообщение, содержащее 2048 символов, если его объем составляет 1.25 Кбайт.
  6. Решение:
    1.25 КБ = 1.25 • 1024 • 8 бит = 10240 бит. Столько информации в тексте
    i = 10240 : 2048 = 5 (бит) приходится на 1 символ
    Находим количество символов в алфавите языка (N), на котором написан текст:
    N = 2i
    N = 25
    N = 32 символа в алфавите

  7. Племя Мумбу-Юмбу использует алфавит из букв: α β γ δ ε ζ η θ λ μ ξ σ φ ψ точка и для разделения слов используется пробел.
    Сколько информации несет свод законов племени, если в нем 12 строк и в каждой строке по 20 символов?

II. Измерение информации: алфавитный подход

Познакомимся с способом измерения информации, который не связывает количество информации с содержанием сообщения, и называется он алфавитным подходом. Смотрим мультик.

Запомним некоторые термины:

Алфави́т (др.-греч. ἀλφάβητος)
Форма письменности, основанная на стандартном наборе знаков. Иначе: это просто набор закорючек, которые мы обычно "рисуем" на бумаге.
Мощность алфавита
Количество знаков (символов) в алфавите. Обозначают обычно N. Нужно просто сосчитать сколько закорючек в алфавите.

Люди придумали множество алфавитов: для записи речи, музыки ...

Имеется множество других алфавитов, например, ноты и т.п.

При алфавитном подходе к определению количества информации отвлекаются от содержания информации и рассматривают информационное сообщение как последовательность знаков определенной знаковой системы. Применение алфавитного подхода удобно прежде всего при использовании технических средств работы с информацией (компьютеров).

В этом случае теряют смысл понятия "новые - старые", "понятные - непонятные" сведения. Алфавитный подход является объективным способом измерения информации в отличие от субъективного содержательного подхода при измерении знаний конкретного человека.

ПРИМЕР. Мощность алфавита только из заглавных букв кириллицы равна 32.

АБВГДЕЖЗИЙКЛМНОПРСТУФХЦЧШЩЬЪЭЮЯ

Будем писать, как это делали до 4-го века нашей эры: без пробелов и знаков препинания, т.е. слитно.

Сколько информации тогда несет один символ? Представьте себе, что текст к вам поступает последовательно, по одному знаку, словно бумажная ленточка, выползающая из телеграфного аппарата. Предположим, что каждый появляющийся на ленте символ с одинаковой вероятностью может быть любым символом алфавита. В каждой очередной позиции текста может появиться любой из N символов. Тогда, согласно известной нам формуле 2i = N, каждый такой символ несет i бит информации, которое можно определить из решения уравнения: 2i = 32. Получаем: i = 5 бит.

Пример:
МАМАМЫЛАРАМУАПАПАКОЛОЛДРОВА

Считаем: 27 букв • на 5 бит = 135 бит информации в нашем тексте.

Для того, чтобы найти количество информации во всем тексте, нужно посчитать число символов в нем и умножить на i .

ПРИМЕР: пусть страница содержит 50 строк. В каждой строке - 60 символов. Значит, на странице умещается 50 • 60 = 3000 знаков. Тогда объем информации будет равен: 5 бит • 3000 = 15000 бит.

Вывод: при алфавитном подходе к измерению информации количество информации зависит не от содержания, а от размера текста и мощности алфавита N.

Двоичный алфавит

А что если алфавит состоит только из двух символов 0 и 1? В этом случае: N = 2;     2i = N;    2i = 21;     i = 1

При использовании двоичной системы (алфавит состоит из двух знаков: 0 и 1) каждый двоичный знак несет 1 бит информации.

"Компьютерный" алфавит (смотрите таблицу)

Удобнее всего измерять информацию, когда размер алфавита N равен целой степени двойки. Например, если N = 16, то каждый символ несет 4 бита информации потому, что 24 = 16. А если N=32, то один символ "весит" 5 бит.

Ограничения на максимальный размер алфавита теоретически не существует. Однако есть алфавит, который можно назвать достаточным. С ним мы встречаемся при работе с компьютером. Это алфавит мощностью 256 символов.

В алфавит такого размера можно поместить все практически необходимые символы: латинские и русские буквы, цифры, знаки арифметических операций, всевозможные скобки, знаки препинания....

Поскольку 256 = 28, то один символ этого алфавита "весит" 8 бит. Причем 8 бит информации - это настолько характерная величина, что ей даже присвоили свое название - байт. 1 байт = 8 бит

Как вычислить количество информации в тексте?

В настоящее время для подготовки писем, документов, статей, книг и пр. используют компьютерные текстовые редакторы. Компьютерные редакторы, в основном, работают с алфавитом размером 256 символов. В этом случае легко подсчитать объем информации в тексте. Если 1 символ алфавита несет 1 байт информации, то надо просто сосчитать количество символов; полученное число даст информационный объем текста в байтах.

ПРИМЕР
Пусть небольшая книжка, сделанная с помощью компьютера, содержит 150 страниц; на каждой странице - 40 строк, в каждой строке - 60 символов. Значит страница содержит 40 • 60 = 2400 байт информации. Объем всей информации в книге: 2400 • 150 = 360000 байт.

Более крупные единицы информации:

Примеры перевода из одной единицы измерения в другие:

Вывод:

Скорость передачи информации

Прием-передача информации могут происходить с разной скоростью.

Скорость передачи информации
Количество информации, передаваемое за единицу времени

Очевидно, эта скорость выражается в таких единицах:


Выводы из прочитанного

  1. Информатика изучает широкий круг вопросов, связанных с автоматической обработкой данных.
  2. Человек получает информацию об окружающем мире с помощью органов чувств.
  3. Данные - это зафиксированная (закодированная) информация. Компьютеры работают только с данными.
  4. Сигнал - это изменение свойств носителя информации. Сообщение - это последовательность сигналов.
  5. Основные информационные процессы — это передача и обработка информации (данных).
  6. Минимальная единица измерения количества информации - это бит. Так называется количество информации, которое можно закодировать с помощью одной двоичной цифры ("0" или "1").
  7. С помощью і битов можно закодировать 2i разных вариантов.
  1. 1 байт содержит 8 битов.
  2. В единицах измерения количества информации используются двоичные приставки:
    • 1 КБайт = 210 байтов = 1024 байтов
    • 1 МБайт = 220 байтов = 1 048 576 байтов
    • 1 ГБайт = 230 байтов = 1 073 741 824 байтов
  3. Информационный объем текста определяется длиной текста и мощностью алфавита. Чем больше символов содержит алфавит, тем больше будет информационный объем одного символа (и текста в целом).
  4. Скорость передачи данных обычно измеряется в битах в секунду (бит/с).
  5. В единицах измерения скорости передачи данных используются десятичные приставки:
    • 1 Кбит/с = 1000 бит/с
    • 1 Мбит/с = 1 000 000 бит/с
    • 1 Гбит/с = 1 000 000 000 бит/с