Во многих областях науки и техники перед исследователями стоит следующая задача: как на основе данных, полученных на конечном интервале времени или пространства, сформировать максимально достоверное представление об исходном образе, с которым связаны эти данные, т.е. о его природе и основных характеристиках. Для решения этой задачи выработаны различные методы анализа данных, изучению которых посвящено пособие.
Анализ данных производится, главным образом, с применением компьютеров; исследователи выполняют, в основном, творческую работу -- ставят задачи, выбирают методы их решения и интерпретируют полученные результаты. Данные, которые получают исследователи в результате проведенных наблюдений или экспериментов, могут быть непрерывными или дискретными. Для обработки на ЭВМ они должны быть представлены в дискретной форме, поэтому непрерывные данные дискретизируются по аргументу и превращаются во временные ряды, если наблюдаемый процесс протекает во времени, или в случайные поля, если процесс развивается в пространстве. Под термином временной ряд понимают последовательность чисел, представляющих собой значения некоторого процесса в дискретные моменты времени. Эти значения измеряются обычно через равные промежутки времени. Если одновременно регистрируются несколько характеристик процесса, то говорят о многомерных временных рядах.
Природа временных рядов различна. Это могут быть данные наблюдений излучения, приходящего из космоса, медицинских и биологических сигналов, информационных потоков в сетях связи, колебательных и волновых процессов в радиофизических устройствах, поведения атмосферных и океанических течений, колебаний земной коры, динамики биологических популяций, показателей финансового рынка и т. п. Все перечисленные процессы порождаются принципиально различными системами или совокупностями систем, но могут быть изучены в рамках единого подхода, заключающегося в обработке экспериментальных данных методами анализа временных рядов. Однако выбор методов сбора, обработки и анализа данных наблюдений в значительной степени зависит от того, какое физическое явление представляет изучаемый процесс, и от целей, которые достигаются обработкой.
Данные, полученные в результате наблюдения реального физического явления, могут рассматриваться как детерминированные либо как случайные. Детерминированные процессы -- это процессы, которые можно описать явными математическими формулами. К ним относятся, например, колебания математического маятника, изменение потенциала между обкладками конденсатора по мере его зарядки или разрядки и т. п. Однако в формировании любого процесса участвует огромное количество факторов, которые невозможно учесть полностью; эти факторы рассматриваются как случайные (неконтролируемые) источники, порождающие недетерминированную (случайную) составляющую процесса. Поэтому общим подходом является анализ процессов в природе и технике как случайных. Именно такие процессы мы будем рассматривать, а понятие реализация случайного процесса будем в дальнейшем отождествлять с понятием временной ряд.
Анализируя временной ряд, исследователи, как правило, не знают его природу, поэтому, прежде всего, стараются разделить анализируемый ряд на детерминированную и случайную составляющие. Далее обычно при изучении временных рядов ставятся следующие цели: описание характерных особенностей ряда; подбор математических моделей анализируемого временного ряда; предсказание будущих значений процесса на основе его предыстории (прошлых наблюдений); управление процессом, порождающим временной ряд.
Наиболее общим подходом является представление временного ряда в виде последовательности случайных величин. В этом случае для анализа вероятностных свойств процесса применяют методы статистической обработки данных -- вероятностные методы анализа, которые являются универсальными и могут применяться к данным различной природы. Другим классическим подходом обработки данных является их спектральный анализ, т.е. оценка гармонического состава процесса (спектра) по данным конечной протяженности. Качество оценки спектра оказывает решающее влияние при формировании наших представлений об исходном явлении. Изучению вероятностных методов и методов спектрального анализа, которые являются классическими, посвящена первая часть пособия. Помимо классических методов, очень часто, учитывая специфику временного ряда и изучаемого явления, приходится применять специальные методы, рассмотрению которых посвящена вторая часть пособия. Специальные методы используются, например, в тех случаях, когда необходимо провести анализ процесса с меняющимися во времени характеристиками или перейти к другому, более информативному представлению исходного временного ряда, раскладывая его на составляющие. К таким методам относятся, в частности, преобразование Гильберта и вейвлет-преобразование.
В третьей части пособия рассматриваются методы, используемые на этапах, предшествующих анализу данных -- основные методы сбора, обработки данных и предварительного анализа, при этом внимание уделяется вероятным источникам ошибок.
Первая часть пособия написана Н.А. Ховановой, вторая и третья -- И.А. Ховановым.
Авторы искренне признательны доценту кафедры радиофизики и нелинейной динамики Т.Е.Вадивасовой за полезные дискуссии и ценные замечания по затронутым в пособии вопросам.