Исследование и классификация артефактов археологического памятника Лузанова Сопка-2
Реферат - История
Другие рефераты по предмету История
?фициент неравномерности, является основанием типологии. Формы венчика и характер формы среза венчика характеризуют вариантные признаки памятника Лузанова Сопка-2.
Для проведения кластерного анализа были выбраны агломеративные иерархические алгоритмы, так как именно они позволяют получить наиболее полное представление о структуре кластеров в виде дендрограммы. В виду того, что не известны методы и меры, используемые для решения такого рода задач, была проведена кластеризация по всем 7 методам, которые реализованы в программе статистического анализа SPSS, для них использовались 25 мер. Число кластеров определялось по динамике изменения порога расщепления (слияния) кластеров. В программе SPSS по каждому методу выводится таблица агломерации, с помощью которой можно оценить число кластеров. Для этого необходимо проследить динамику увеличения расстояний по шагам кластеризации и определить шаг, на котором отмечается резкое возрастание расстояний. Оптимальному числу кластеров соответствует разность между числом объектов и порядковым номером шага, на котором было обнаружено максимальное расстояние.
Проанализировав таблицы агломерации, была построена таблица, в которой отмечено количество кластеров по всем методам и мерам.
Результаты кластеризации, когда получилось 2 и 20 кластеров считаются не верными, потому что это означает, что-либо все сосуды принадлежат одному кластеру, либо каждый сосуд - это отдельный кластер. По этой причине, методы связь внутри групп, ближайший сосед, дальний сосед, кластеринг медиан и метод Уорда исключаются из анализа. По этой же причине исключаются из рассмотрения семь мер: различие размера, вариация, дисперсия, лямбда, Рассел и Рао, Сокал и Снит 2, Сокал и Снит 5.
В большинстве случае анализ оставшихся 2 методов и 18 мер показывает, что сосуды делятся на 10 - 11 кл.
Сравнение результатов иерархических методов было проведено с результатом метода К-средних. Перед выполнением метода К-средних был проведен факторный анализ, для объединения зависимых признаков к меньшему количеству независимых между собой факторов. Таким образом, 21 признак был объединен в 7 факторов. Принадлежность признаков к факторам определяется по матрице вращения.
Матрица вращения состоит из факторных нагрузок. Максимальное абсолютное значение факторной нагрузки указывает на отношение данного признака к фактору, что позволяется разделить признаки на группы.
Для подтверждения правильности распределения признаков по факторам были построены матрица корреляций, используя коэффициент Пирсона, и граф связей признаков.
Граф связей признаков
венчик энтропия пирсон сосуд
Двойной линией в графе соединены признаки, имеющие наибольший коэффициент корреляции, одинарной - наименьший, пунктирной линией - с обратной зависимостью. В графе связей объединяются в группы признаки, исходя из факторного анализа. Как видно из графа, группы не пересекаются между собой, что подтверждает их разделение факторным анализом.
Затем был проведен метод К-средних, использующий вместо признаков полученные значения факторов. В этом методе необходимо указывать количество кластеров. Так как иерархические методы показали, что должно быть 10-11 кластеров, то неиерархическим анализом была произведена кластеризация для такого количества кластеров.
Сравнения результатов иерархических и метода К-средних показывает совпадение разделения на кластеры 18 сосудов из 23, что составляет 78%. Окончательным решение задачи кластеризации является таблица, в которой указаны группы сосудов:
Группы сосудов12345678910Сосуд 7Сосуд4Сосуд8Сосуд6Сосуд13Сосуд22Сосуд1Сосуд2Сосуд3Сосуд17Сосуд14Сосуд26Сосуд9Сосуд12Сосуд15Сосуд23Сосуд18Сосуд27Сосуд28Сосуд19Сосуд20Сосуд21Сосуд25
Наибольшей по количеству сосудов группе соответствуют признаки, присущие памятнику Лузанова Сопка-2: прямой венчик, заостренная кромка, орнамент на кромке, гребенка вертикальная, гребенка диагональная.
В последних четырех группах присутствуют признаки, которых нет на остальных сосудах, но на них много признаков из основной (многочисленной) группы, что означает, что не сосуд пришел из другой культуры, а лишь орнаментальный признак.
Также было выявлено, что орнамент на кромке влияет на форму среза венчика.
Список литературы
1.Барсегян А.А. Технологии анализа данных: Data Mining, Visual Mining, Text Mining, OLAP.-2-е изд., прераб. и доп.-С-П.,2008.
.Ким Дж.-О. Факторный, дискриминантный и кластерный анализ.-М.: Финансы и статистика, 1989.-215 с.:ил.
.Наследов А. SPSS 15 профессиональный статистический анализ данных.-С-П.,2008.