Теоретические основы программирования


Древняя азбука - древние основы

Учиться никогда не поздно, но не всегда целесообразно...

Автор

Содержание курса

Теория и практика:
Что такое программирование
Устройство и принцип работы компьютера
Основные конструкции языка программирования
Простейшая программа на Java
Базовые типы Java, литералы, переменные и константы, приведение типов, основные операторы
Java класс Math
Операторы сравнения и логические операторы. Ветвление в программе. Условный оператор.
Ветвление в программе. Вложенные условные операторы. Оператор множественного выбора
Потоки ввода/вывода и строки в Java
Циклы в Java
Массивы в Java
Статические методы в Java, перегрузка методов, рекурсия
Создание собственных классов в Java: свойства, методы, конструкторы
Создание класса: инкапсуляция, полиморфизм
Абстрактные классы и методы. Интерфейсы. Множественное наследование интерфейсов
Исключения и их обработка

Структуры данных и оценка сложности алгоритмов
Что такое объектно-ориентированное программирование


Немного теории или пара слов об алгоритме, псевдокоде и блок-схемах

Это вводная часть, посвященная теоретическим основам программирования. Читатель может ознакомиться с ней и затем перейти к изучению программирования на практике (ссылки в начале и в конце этого материала), может обратиться к практическим упражнениям сразу, а может продолжить знакомиться с теорией разработки программных продуктов, выбирая интересующие его вопросы из вышеприведенного списка. Что касается данной статьи, то вот ее основные разделы:

Что такое алгоритм, процесс программирования, оператор и псевдокод
Переменные и их классификация
Про отладку, компиляцию и запуск программы

Совет: Читая дальнейший материал, не старайтесь запомнить все встречающиеся по ходу повествования термины и определения. Все встанет на свои места со временем, тем более что гипертекст интернет страниц тем и хорош, что ссылки на развернутое изложение материала можно обнаружить там, где это необходимо. Вы всегда сможете вернуться на нужную страницу и сделать это ровно тогда, когда ощутите дефицит знаний. Если какой-либо раздел вызывает у вас трудности в плане его осознания – пропустите его. Если в дальнейшем вы к нему не вернетесь, то это означает, что он в процессе изучения основ программирования для вас оказался лишним.

Что такое алгоритм, программирование и псевдокод

Начнем с того, что определим, что такое алгоритм. Алгоритм – это порядок действий, которые необходимо выполнить, чтобы решить определенную задачу. Понятие алгоритма не связано только лишь с программами, выполняемыми на компьютере, поэтому на вопрос “кому необходимо выполнить” ответом может быть кто или что угодно: человек, робот, вычислительная техника и т.д. Алгоритм – это инструкция или руководство или, наконец, просто программа действий. В этом случае программирование – это описание алгоритма средствами языка программирования, конструкции которого компьютер умеет обрабатывать. Или же просто это процесс написания текста компьютерной программы. В такой интерпретации синонимом программированию является процесс кодирования (coding). Почему я заговорил про интерпретации? Дело в том, что разработчики программного обеспечения очень трепетно относятся к тому, чем они занимаются, и могут быть крайне недовольны, когда их деятельность сводят только лишь к процессу кодирования на конкретном языке программирования. Сам процесс создания программных продуктов – это не только кодирование, но и предваряющий этап проектирования, а также последующие этапы тестирования и сопровождения. Под программированием чаще имеют в виду процесс создания компьютерной программы в целом, в том числе и разработку алгоритма, а кодирование – это перевод уже разработанного алгоритма на язык, понятный объекту кодирования (имеется в виду компьютер или любое другое устройство, работающее по заданной кем-то программе).

Итак, алгоритм любой задачи, описанный на любом алгоритмическом языке (процедурном языке программирования), в первом приближении предстает в виде последовательности инструкций или операторов. Оператор может быть простым или составным. Простой оператор – это атомарная единица языка программирования. К простым операторам относят объявление переменной (определение имени и типа переменной), инициализацию переменной (присвоение переменной значения), вызов процедуры, операции ввода и вывода информации и т.д.

Переменная (в программировании) – это поименованная область оперативной памяти, предназначенная для временного хранения порции данных, обрабатываемой компьютерной программой. Переменная характеризуется размером занимаемой памяти и типом, который определяет то, каким образом эта память интерпретируется компьютером. Тип переменной может быть простым или составным (комплексным). К простым типам относится числовой, символьный и логический тип. Составной тип - это набор простых и/или других составных типов.

Составные операторы используются для организации других операторов в последовательности и управления ходом выполнения программы. К составным операторам относят циклы (повторение последовательности операторов), условные операторы, операторы выбора и т.п. Математические и логические выражения сами по себе операторами не являются. Они могут быть аргументами операторов присваивания значений переменным или критериями выполнения циклов и условных операторов. Частью математических и логических выражений могут быть вызовы функций.

Промежуточные итоги: Простейшая компьютерная программа – это последовательность операторов (программных инструкций), одни из которых модифицируют переменные, а другие управляют ходом выполнения программы (циклы, условные операторы), на основании условий, заданных логическими и арифметическими выражениями.

Если что-то из всего этого вызывает вопросы, то предлагаю перейти по любой из приведенных выше ссылок и познакомиться с описанными мной конструкциями процедурного языка программирования подробнее.

Раньше алгоритмы, перед тем как реализовать их на процедурном языке программирования, представляли в виде блок-схем. На сегодня, как мне кажется, к классическим блок-схемам прибегают довольно редко (в школах или на различных курсах основ программирования). Также, блок-схемы используют при описании бизнес-процессов совместно с UML диаграммами, но это уже относится к этапам макропроектирования. Я в своей практике весьма редко использую какие-то промежуточные формы описания алгоритмов, но если такая необходимость возникает, то делаю это с использованием псевдокода. Псевдокод – это псевдоязык программирования, на синтаксис которого стандартов не существует. Псевдокод лишен несущественных для понимания сути алгоритма деталей, без которых никак при написании программ на реальных языках программирования. Единственная цель псевдокода – формализовать описание алгоритма. Задачи, решения которых описаны на псевдокоде, очень легко переносятся на любой язык программирования, поскольку псевдокод и есть язык программирования с той лишь разницей, что для него не существует компилятора, а единственным интерпретатором для него является человеческий мозг. Что такое компилятор и интерпретатор я расскажу в конце этого материала.

Примеры алгоритмов на псевдокоде и в виде блок-схем

Вот пример описания алгоритма задачи деления одного числа на другое, выполненного на псевдокоде:

A : ЦЕЛОЧИСЛЕННЫЙ ТИП
ВВОД(A)
B : ЦЕЛОЧИСЛЕННЫЙ ТИП
ВВОД(B)

ЕСЛИ B=0 ТО
      ВЫВОД(“ОШИБКА: ДЕЛЕНИЕ НА 0!”)
      ВЫХОД
КОНЕЦ ЕСЛИ

C : ВЕЩЕСТВЕННЫЙ ТИП
C = A / B
ВЫВОД(C)
                                                        

Ниже еще один пример программы на псевдокоде - алгоритм простейшей игры “Угадай число”, с которой довольно часто начинают многие курсы программирования для начинающих. Ну, вот и этот курс не стал исключением. Пример иллюстрирует использование составных операторов, в том числе их суперпозицию: условие в цикле и вложенное условие. Читая псевдокод, становится понятно, что общение с вычислительной техникой на классическом языке программирования очень похоже на обычное человеческое общение (иногда в повелительном наклонении).

N : ЦЕЛОЧИСЛЕННЫЙ ТИП
N=СЛУЧАЙНОЕ_ЧИСЛО(100)

РЕЗУЛЬТАТ : ЛОГИЧЕСКИЙ ТИП
РЕЗУЛЬТАТ = ЛОЖЬ

ЦИКЛ ПОКА РЕЗУЛЬТАТ = ЛОЖЬ
      ВАРИАНТ : ЦЕЛОЧИСЛЕННЫЙ ТИП
      ВВОД(BАРИАНТ)

      ЕСЛИ ВАРИАНТ=N ТО
           ВЫВОД(“УГАДАЛ!”)
           РЕЗУЛЬТАТ=ИСТИНА
      ИНАЧЕ
           ЕСЛИ ВАРИАНТ < N ТО
                ВЫВОД(“ЗАГАДАННОЕ ЧИСЛО БОЛЬШЕ!”)
           ИНАЧЕ
                ВЫВОД(“ЗАГАДАННОЕ ЧИСЛО МЕНЬШЕ!”)
           КОНЕЦ ЕСЛИ
      КОНЕЦ ЕСЛИ
КОНЕЦ ЦИКЛА 'Переход к проверке условия цикла'
                                                        

Пример описания алгоритма этой же задачи средствами блок-схем приведен ниже. Глядя на него, не сложно для себя решить, с помощью какого инструмента описания алгоритмов: псевдокод или блок-схемы, само описание выглядит более наглядно, более компактно или, наконец, более понятно. Каждый выбирает то, что больше нравится ему и не более того.

Блок-схема алгоритма игры "Угадай число"
Блок-схема алгоритма игры "Угадай число", условные обозначения блок-схем.

Переменные и их классификация, составные типы и немного о процессах управления памятью

Область видимости переменных

По большому счету, все программы занимаются одним и тем же – обрабатывают данные. Данные в программе представлены переменными различных типов: от элементарных до сложных структур и классов. Переменные могут быть организованы в массивы и коллекции – поименованные наборы однотипных данных, доступ к отдельным элементам которых осуществляется по индексу. Любая переменная в программе характеризуется областью видимости и жизненным циклом.

По области видимости переменные можно классифицировать следующим образом:

  • Локальная переменная – переменная доступна только в границах отдельной процедуры или составного оператора. Из названия понятно, что такие переменные объявляют и инициализируют для решения каких-либо локальных задач, например: для хранения номера итерации цикла или промежуточного результата некоторой операции.

  • Параметр процедуры или функции – переменная, доступ к которой имеется из любого места процедуры или функции, аргументом которой она является. В примере, который размещен ниже, для процедуры ВЫВОД_АДРЕСА определен аргумент А типа АДРЕС. Значение аргумента в примере определяется значением локальной (в контексте основной программы) одноименной переменной. То, что имя локальной переменной и имя аргумента процедуры совпадают - не является обязательным условием, поскольку это разные элементы программы и они имеют право иметь различные имена.

  • Член структуры или класса – часть составного типа. Пример – составные части адреса (смотри пример ниже). Область видимости таких элементов может совпадать с областью видимости всего экземпляра, а может быть ограничена до рамок “внутреннего” использования.

  • Глобальные переменные – доступ к таким переменным есть из любой части программы в любой момент времени исполнения. Рекомендуется избегать использования глобальных переменных без особого на то резона, поскольку оно может приводить к нерациональному расходу памяти.

К отдельной категории переменных следует отнести константы, значение которым присваивается только один раз на протяжении их жизненного цикла и далее остается неизменным. Для констант справедлива вся вышеперечисленная классификация.

Раздел определений программы

Помимо последовательности операторов любая программа характеризуется разделом определений. Раздел определений, как следует из его названия, содержит определения сложных или составных типов, а также определения процедур и функций. К составным типам относят структуры и классы, которые используются в тех случаях, когда элементарных типов для хранения информации недостаточно. Элементарные типы – это целочисленные, вещественные, строковые, логические и прочие подобные типы данных. Для организации хранения того же адреса проживания ни один из элементарных типов в чистом виде не подойдет. Зато с этой задачей легко справится структура, которая может объединить, например, строковый тип для хранения наименования улицы и целочисленные типы для хранения номера дома, номера корпуса и т.д. Процедуры и функции, в свою очередь, группируют повторяющиеся и/или логически завершенные фрагменты кода, дают этим фрагментам осмысленные имена, а для функций еще и определяют тип возвращаемого значения. Пример того, как можно было бы изобразить раздел определений на псевдокоде показан ниже (в кавычках размещены комментарии).

‘Раздел определений:’
'Определение структуры АДРЕС для хранения составляющих милицейского адреса'
СТРУКТУРА АДРЕС
     УЛИЦА : СТРОКА
     НОМЕР_ДОМА : ЦЕЛОЧИСЛЕННЫЙ ТИП
     БУКВА_ДОМА : СИМВОЛ
     КОРПУС : ЦЕЛОЧИСЛЕННЫЙ ТИП
КОНЕЦ СТРУКТУРЫ

'Процедура вывода адреса на экран, аргументом которой является экземпляр структуры АДРЕС'
ПРОЦЕДУРА ВЫВОД_АДРЕСА(А : АДРЕС)
     ВЫВОД(“УЛ. {1} Д. {2}{3} К. {4} ”, А.УЛИЦА, А.НОМЕР_ДОМА, А.БУКВА_ДОМА, А.КОРПУС)
КОНЕЦ ПРОЦЕДУРЫ

‘Основная программа’
ПРОГРАММА
     'объявление локальной переменной А составного типа АДРЕС
     А : АДРЕС
 
     'Присвоение значений элементам структуры переменной А'
     А.УЛИЦА=’СЕВЕРНАЯ’
     А.НОМЕР_ДОМА=3
     А.БУКВА_ДОМА=’А’
     А.КОРПУС=1

     'Вызов процедуры вывода адреса на экран с передачей в качестве аргумента переменной А'
     ВЫВОД_АДРЕСА(А)
КОНЕЦ ПРОГРАММЫ
                                                        

В некоторых языках программирования раздел определений явно выделен, в некоторых - он равномерно распределен по всей программе и не имеет четких границ с исполняемым кодом. В каждой процедуре или функции может быть свой, локальный раздел определений. Классы объединяют в себе достоинства структур, процедур и функций. Процедуры и функции в контексте класса называются методами класса. О классах речь пойдет позже, а начнем мы с самых простых примеров программ. Перед тем, как перейти непосредственно к программированию буквально пару слов об особенностях жизненного цикла переменных и о том, что происходит с момента, когда программный код написан и до момента, когда он начинает работать.

Особенности жизненного цикла переменных

Что касается жизненного цикла переменной, то он соответствует времени с момента выделения памяти под ее значение и до момента освобождения этой памяти. Естественно, что жизненный цикл локальных переменных и параметров процедур и функций ограничен временем исполнения соответствующих фрагментов кода, а жизненный цикл членов структур и классов – жизненным циклом экземпляра всей структуры или класса. Можно также сказать, что жизненный цикл переменной начинается в момент появления ее в области видимости и заканчивается тогда, когда переменная эту область покидает. Если строго следовать этой терминологии, то необходимо сделать небольшой экскурс в тонкости процессов выделение памяти под переменную и ее освобождения. Дело в том, что как минимум при объявлении элементарных типов, память для них выделяется сразу же по месту их объявления и освобождается автоматически после того, как переменная покидает область видимости. В этом случае память выделяется из стека – из наиболее “дорогой” области памяти, в которой хранится и сам исполняемый код. В C# и VB.NET структуры также размещаются в стеке. Для экземпляров сложных типов, таких как классы, память выделяется из общей кучи (heap) при помощи специального оператора (оператор new в языках программирования C++, Java, C#, VB.NET). Объем кучи превосходит объем стека, но по времени доступа к значению переменной ему уступает. Освобождается память в куче также при помощи отдельного оператора или при помощи специальных механизмов, работающих в фоновом режиме. Таким образом, для классов имеет место следующая ситуация: в область видимости их экземпляры попадают раньше, чем начинается их жизненный цикл, а покидают область видимости они, соответственно, уже после его окончания. В этом случае до выделения памяти "живет" не сама переменная, а указатель на переменную. Поскольку управление памятью происходит в “ручном” режиме, то ее выделение и освобождение можно выполнять неоднократно, что делает жизненный цикл таких переменных прерывистым. Ниже иллюстрация к сказанному на "C-подобном" языке программирования.

        {
            //Начало области видимости локальной переменной 'c' (объявление переменной)
            MyClass c;
            //Начало жизненного цикла (выделение памяти)
            c = new MyClass(); 
            ...
            Манипуляции с переменной
            ...
            //Прерывание жизненного цикла (освобождение памяти)
            c = null;
            ...
            Прочие вычисления
            ...
            //Продолжение жизненного цикла (повторное выделение памяти)
            c = new MyClass(); 
            ...
            Манипуляции с переменной
            ...
            //Окончание жизненного цикла (освобождение памяти)
            c = null;            
        }//Конец области видимости локальной переменной 'c' (окончание блока, где она была определена)
                                                        

Есть случаи, когда элементарные типы размещают в куче, а сложные типы в стеке. Управление памятью – весьма серьезный элемент программирования, который может с одной стороны оптимизировать вашу программу с точки зрения времени ее выполнения и расхода ресурсов, а с другой – стать причиной ошибок, если делать это неаккуратно.

В языках программирования платформы Microsoft .NET, к которым относятся C# и VB.NET, процессом освобождения памяти управляет специальный механизм – "сборщик мусора" (Garbage Collector), который работает в отдельном фоновом потоке. Профессионалов это может раздражать, но в целом такое обстоятельство позволяет не забивать себе голову лишними проблемами и быть уверенным, что рано или поздно вся занятая вашей программой память будет возвращена операционной системе.

Отладка, компиляция, компоновка, загрузка и исполнение программы

Этот раздел содержит список ключевых определений, связанных с обработкой, загрузкой и запуском программы на компьютере. Чтобы понять все тонкости процессов, происходящих с программой, начиная с момента написания ее исходного кода и до начала ее исполнения компьютером, я настоятельно рекомендую прочитать раздел о том, из чего состоит компьютер и по каким принципам он работает.

Интегрированная среда разработки (IDE, Integrated development environment) – совокупность программных средств, предлагающих пользователю инструменты для написания программного кода, поиска и выделения в нем синтаксических ошибок и запуска приложения в режиме отладки. В состав интегрированной среды разработки входят компилятор, компоновщик, отладчик, профайлер и другие компоненты. Наиболее популярной средой разработки программных продуктов на языках программирования C#, VB.NET и C++ является Microsoft Visual Studio, а для учебных целей я предлагаю использовать следующий инструментарий для начинающих программистов.

Отладчик (debugger) – инструмент IDE, позволяющий выполнять программу в пошаговом режиме и отслеживать значения переменных на каждом из шагов, определенных точками останова или контрольными точками (break point).

Профайлер (profiler) – инструмент IDE, используемый для оптимизации программного кода по скорости его выполнения и занимаемой им оперативной памяти. С помощью профайлера можно собрать статистику, какая часть кода выполняется чаще всего, и сколько времени и ресурсов на ее выполнение тратит компьютер. На основе этой статистики можно выявить “узкие места” вашей программы и направить свои усилия на их оптимизацию.

Язык программирования – формальный язык, представленный набором инструкций (операторов), с помощью которых, с соблюдением определенного синтаксиса пишутся компьютерные программы. По-другому, язык программирования – это основной инструмент реализации алгоритма конкретной задачи на компьютере.

Машинный код – система команд, которые процессор компьютера понимает “без перевода”.

Языки программирования высокого и низкого уровня – классификация языков программирования по степени удобства их использования человеком для решения прикладных задач (языки высокого уровня) или по степени близости их к машинному коду (языки низкого уровня).

Компилятор (compiler) – приложение, которое занимается процессом компиляции - переводом программы (трансляцией программного кода), написанной на языке программирования высокого уровня на язык низкого уровня или в машинный код. Под компиляцией на язык низкого уровня чаще всего подразумевается трансляция программы на язык ассемблера с тем, чтобы выполнить “тонкую” настройку отдельных “узких мест” перед тем как окончательно перевести ее в машинный код. Пример программы на ассемблере можно увидеть здесь.

Объектный модуль – файл, содержащий результат работы компилятора, а именно сам машинный код со ссылками на другие объектные модули, если программа сложная и состоит из множества компонентов.

Компоновщик (linker) – приложение, которое вступает в процесс создания исполняемого модуля после компилятора. Если результат компиляции – это несколько объектных модулей, то компоновщик всех их находит и строит из них исполняемый модуль.

Исполняемый модуль – файл, содержащий программу ровно в том виде, который способен обработать загрузчик конкретной операционной системы. Чаще всего это файлы с расширением exe или dll.

Загрузчик (loader) – часть операционной системы, которая создает для программы отдельный процесс, загружает в оперативную память (в область оперативной памяти, выделенную для процесса) данные исполняемого файла, инициализирует регистры процессора и стартует процесс. С этого момента программа начинает выполняться.

Интерпретатор (interpreter) – программа, исполняющая программный код пошагово, транслируя в машинный код только ту его часть, которую необходимо исполнить в конкретный момент времени. Интерпретатор обрабатывает программу построчно. Отличие компилятора от интерпретатора в том, что компилятор транслирует в машинный код сразу всю программу, создавая при этом один или несколько объектных модулей, а интерпретатор, выполнив трансляцию только нужного ему фрагмента программы, сразу же этот фрагмент и выполняет. Таким образом, некоторые интерпретаторы – это компилятор, компоновщик и загрузчик в одном флаконе. Примером интерпретатора является блок обработки JavaScript сценариев в интернет браузере.

На этом с теорией я позволю себе закончить и перейду к практике. Начну с того, как новичку выбрать язык программирования.