Исследование и классификация артефактов археологического памятника Лузанова Сопка-2

Реферат - История

Другие рефераты по предмету История

?фициент неравномерности, является основанием типологии. Формы венчика и характер формы среза венчика характеризуют вариантные признаки памятника Лузанова Сопка-2.

Для проведения кластерного анализа были выбраны агломеративные иерархические алгоритмы, так как именно они позволяют получить наиболее полное представление о структуре кластеров в виде дендрограммы. В виду того, что не известны методы и меры, используемые для решения такого рода задач, была проведена кластеризация по всем 7 методам, которые реализованы в программе статистического анализа SPSS, для них использовались 25 мер. Число кластеров определялось по динамике изменения порога расщепления (слияния) кластеров. В программе SPSS по каждому методу выводится таблица агломерации, с помощью которой можно оценить число кластеров. Для этого необходимо проследить динамику увеличения расстояний по шагам кластеризации и определить шаг, на котором отмечается резкое возрастание расстояний. Оптимальному числу кластеров соответствует разность между числом объектов и порядковым номером шага, на котором было обнаружено максимальное расстояние.

Проанализировав таблицы агломерации, была построена таблица, в которой отмечено количество кластеров по всем методам и мерам.

Результаты кластеризации, когда получилось 2 и 20 кластеров считаются не верными, потому что это означает, что-либо все сосуды принадлежат одному кластеру, либо каждый сосуд - это отдельный кластер. По этой причине, методы связь внутри групп, ближайший сосед, дальний сосед, кластеринг медиан и метод Уорда исключаются из анализа. По этой же причине исключаются из рассмотрения семь мер: различие размера, вариация, дисперсия, лямбда, Рассел и Рао, Сокал и Снит 2, Сокал и Снит 5.

В большинстве случае анализ оставшихся 2 методов и 18 мер показывает, что сосуды делятся на 10 - 11 кл.

Сравнение результатов иерархических методов было проведено с результатом метода К-средних. Перед выполнением метода К-средних был проведен факторный анализ, для объединения зависимых признаков к меньшему количеству независимых между собой факторов. Таким образом, 21 признак был объединен в 7 факторов. Принадлежность признаков к факторам определяется по матрице вращения.

Матрица вращения состоит из факторных нагрузок. Максимальное абсолютное значение факторной нагрузки указывает на отношение данного признака к фактору, что позволяется разделить признаки на группы.

Для подтверждения правильности распределения признаков по факторам были построены матрица корреляций, используя коэффициент Пирсона, и граф связей признаков.

Граф связей признаков

венчик энтропия пирсон сосуд

 

 

Двойной линией в графе соединены признаки, имеющие наибольший коэффициент корреляции, одинарной - наименьший, пунктирной линией - с обратной зависимостью. В графе связей объединяются в группы признаки, исходя из факторного анализа. Как видно из графа, группы не пересекаются между собой, что подтверждает их разделение факторным анализом.

Затем был проведен метод К-средних, использующий вместо признаков полученные значения факторов. В этом методе необходимо указывать количество кластеров. Так как иерархические методы показали, что должно быть 10-11 кластеров, то неиерархическим анализом была произведена кластеризация для такого количества кластеров.

Сравнения результатов иерархических и метода К-средних показывает совпадение разделения на кластеры 18 сосудов из 23, что составляет 78%. Окончательным решение задачи кластеризации является таблица, в которой указаны группы сосудов:

 

Группы сосудов12345678910Сосуд 7Сосуд4Сосуд8Сосуд6Сосуд13Сосуд22Сосуд1Сосуд2Сосуд3Сосуд17Сосуд14Сосуд26Сосуд9Сосуд12Сосуд15Сосуд23Сосуд18Сосуд27Сосуд28Сосуд19Сосуд20Сосуд21Сосуд25

Наибольшей по количеству сосудов группе соответствуют признаки, присущие памятнику Лузанова Сопка-2: прямой венчик, заостренная кромка, орнамент на кромке, гребенка вертикальная, гребенка диагональная.

В последних четырех группах присутствуют признаки, которых нет на остальных сосудах, но на них много признаков из основной (многочисленной) группы, что означает, что не сосуд пришел из другой культуры, а лишь орнаментальный признак.

Также было выявлено, что орнамент на кромке влияет на форму среза венчика.

 

Список литературы

 

1.Барсегян А.А. Технологии анализа данных: Data Mining, Visual Mining, Text Mining, OLAP.-2-е изд., прераб. и доп.-С-П.,2008.

.Ким Дж.-О. Факторный, дискриминантный и кластерный анализ.-М.: Финансы и статистика, 1989.-215 с.:ил.

.Наследов А. SPSS 15 профессиональный статистический анализ данных.-С-П.,2008.