Душкин Роман Викторович darkus@yandex ru Москва, 2001 лекция

Вид материала

Содержание

Лекция 2. «Структуры данных и базисные операции»
Несколько слов о программной реализации
Рисунок 1. Представление пары в памяти компьютера
Рисунок 2. Графическое представление списочной структуры [a1, [a2, a3, [a4]], a5]

Подобный материал:

1 2 3 4 5 6 7 8 9 ... 19

Благодарности

Особую благодарность хочется выразить Сергиевскому Георгию Максимовичу, который в своё время обучил меня основам функционального программирования и помог с организацией этого курса лекций.

Также хочется выразить благодарность Клочкову Андрею, моему коллеге, который с удовольствием помогал мне в создании этого курса.

Лекция 2. «Структуры данных и базисные операции»

Как уже говорилось в первой лекции, основой функциональной парадигмы программирования в большей мере являются такие направления развития математической мысли, как комбинаторная логика и -исчисление. В свою очередь последнее более тесно связано с функциональным программированием, и именно -исчисление называют теоретическими основами функционального программирования.

Для того, чтобы рассматривать теоретические основы функционального программирования, необходимо в первую очередь ввести некоторые соглашения, описать обозначения и построить некоторую формальную систему.

Пусть заданы объекты некоторого первичного типа A. Сейчас совершенно не важно, что именно представляют собой эти выделенные объекты. Обычно считается, что на этих объектах определён набор базисных операций и предикатов. По традиции, которая пошла ещё от МакКарти (автор Lisp’а), такие объекты называются атомами. В теории фактический способ реализации базисных операций и предикатов совершенно не важен, их существование просто постулируется. Однако каждый конкретный функциональный язык реализует базисный набор по-своему.

В качестве базисных операций традиционно (и в первую очередь это объясняется теоретической необходимостью) выделяются следующие три:

Операция создания пары — prefix (x, y)  x : y  [x | y]. Эта операция также называется конструктором или составителем.
Операция отсечения головы — head (x)  h (x). Это первая селективная операция.
Операция отсечения хвоста — tail (x)  t (x). Это вторая селективная операция.

Селективные операции отсечения головы и хвоста также называют просто селекторами. Выделенные операции связаны друг с другом следующими тремя аксиомами:

head (x : y) = x
tail (x : y) = y
prefix (head (x : y), tail (x : y)) = (x : y)

Всё множество объектов, которые можно сконструировать из объектов первичного типа в результате произвольного применения базисных операций, носит название множество S-выражений (обозначение — Sexpr (A)). Например:

a₁ : (a₂ : a₃)  Sexpr

Для дальнейших исследований вводится фиксированный атом, который также принадлежит первичному типу A. Этот атом в дальнейшем будет называться «пустым списком» и обозначаться символами [] (хотя в разных языках функционального програмирования могут существовать свои обозначения для пустого списка). Теперь можно определить то, чем собственно занимается функциональное программирование — собственное подмножество List (A)  Sexpr (A), которое называется «список над A».

Определение:

1. Пустой список []  List (A)

2. x  A & y  List (A)  x : y  List (A)

Главное свойство списка: x  List (A) & x  []  head (x)  A; tail (x)  List (A).

Для обозначения списка из n элементов можно употреблять множество различных нотаций, однако здесь будет использоваться только такая: [a₁, a₂, ..., a_n]. Применяя к такому списку определенным образом операции head и tail можно добраться до любого элемента списка, т.к.:

head ([a₁, a₂, ..., a_n]) = a₁

tail ([a₁, a₂, ..., a_n]) = [a₂, ..., a_n] (при n > 0).

Кроме списков вводится еще один тип данных, который носит название «списочная структура над A» (обозначение — List_str (A)), при этом можно построить следющую структуру отношений: List (A)  List_str (A)  Sexpr (A). Определение списочной структуры выглядит следующим образом:

Определение:

1. a  A  a  List_str (A)

2. List (List_str (A))  List_str (A)

Т.е. видно, что списочная структура — это список, элементами которого могут быть как атомы, так и другие списочные структуру, в том числе и обыкновенные списки. Примером списочной структуры, которая в тоже время не является простым списком, может служить следующее выражение: [a₁, [a₂, a₃, [a₄]], a₅]. Для списочных структур вводится такое понятие, как уровень вложенности.

Несколько слов о программной реализации

Пришло время уделить некоторое внимание рассмотрению программной реализации списков и списочных структур. Это необходимо для более тонкого понимания того, что происходит во время работы функциональной программы, как на каком-либо реализованном функциональном языке, так и на абстрактном языке.

К

аждый объект занимает в памяти машины какое-то место. Однако атомы представляют собой указатели (адреса) на ячейки, в которых содержатся объекты. В этом случае пара z = x : y графически может быть представлена так, как показано на следующем рисунке.

Рисунок 1. Представление пары в памяти компьютера

Адрес ячейки, которая содержит указатели на x и y, и есть объект z. Как видно на рисунке, пара представлена двумя адресами — указатель на голову и указатель на хвост. Традиционно первый указатель (на рисунке выделен голубым цветом) называется a-поле, а второй указатель (на рисунке — зеленоватый) называется d-поле.

Для удобства представления объекты, на которые указывают a- и d-поля, в дальнейшем будут записываться непосредственно в сами поля. Пустой список будет обозначаться перечеркнутым квадратом (указатель ни на что не указывает).

Т

аким образом, списочная структура, которая рассмотрена несколькими параграфами ранее ([a₁, [a₂, a₃, [a₄]], a₅]) может быть представлена так, как показано на следующем рисунке:

Рисунок 2. Графическое представление списочной структуры [a1, [a2, a3, [a4]], a5]

На этом рисунке также хорошо проиллюстрировано понятие уровня вложенности — атомы a₁ и a₅ имеют уровень вложенности 1, атомы a₂ и a₃ — 2, а атом a₄ — 3 соответственно.

Остается отметить, что операция prefix требует расхода памяти, ибо при конструировании пары выделяется память под указатели. С другой стороны обе операции head и tail не требуют памяти, они просто возвращают адрес, который содержится соответственно в a- или d-поле.