Методы статистического анализа текста

Информация - Иностранные языки

Другие материалы по предмету Иностранные языки

?в в 1-й и во 2-й зонах, Т3x - количество журналов, содержащих 3х статей, т.е. сумма наименований журналов в 1-й, 2-й и в 3-й зонах, Т4x - количество журналов, содержащих 4х статей.

Тогда эта закономерность будет иметь вид:

: T2x : T3x : T4x : ... = 1 : a : a2 : a3 : ...

 

Данное выражение называют законом Бредфорда в толковании Б. Викери.

Если закон Ципфа характеризует многие явления социального и биологического характера, то закон Бредфорда - это специфический случай распределения Ципфа для системы периодических изданий по науке и технике.

4. Контент-анализ

 

.1 Определение контент-анализа

 

Появление такого метода как контент-анализ среди других методов статистического анализа было обусловлено прежде всего тем, что возникла потребность в создании определенного объективного метода анализа текста, результаты которого не зависели бы ни от личности исследователя, ни от того где и когда проводятся эти исследования.

Контент-анализ является именно таким методом оценки текстов, при котором не появляется непонимания и разногласий между исследователями, дается возможность воспроизведения в любое время.

На сегодняшний день существует множество трактовок понятия контент-анализа, а так же взглядов на суть и содержание данного метода статистического анализа текста. Рассмотрим наиболее часто употребляемые определения.

Во-первых, самым распространенным является перевод контент-анализа как анализа содержания, от английского contents - содержание (содержимое). При таком толковании получается, что под контент-анализом нужно понимать лишь содержательный анализ текстов. Но это в корне не верно, ведь данный анализ текста задумывался как строгий метод оценки текстов. Контент-анализ не занимается выявлением смысла, он занимается исключительно частотным распределением смысловых единиц в тексте.

Во-вторых, контент-анализ легко путают с реферированием текстов, а также с поисков информации в текстовых базах данных. Данное понимание так же не соответствует истинному назначению контент-анализа.

В-третьих, существует более научное определение контент-анализа заключающееся в том, что контент-анализ определяется как количественный анализ текстов и текстовых массивов с целью последующей содержательной интерпретации выявленных числовых закономерностей.

Философский смысл контент-анализа, как исследовательского метода, состоит в восхождении от многообразия текстового материала к абстрактной модели содержания текста. В указанном смысле, контент-анализ является одной из номотетических исследовательских процедур, используемых в сфере применения идеографических методов.

Кратко перечислим еще одни из известных определений:

Контент-анализ - это методика объективного качественного и систематического изучения содержания средств коммуникации (Д. Джери, Дж. Джери)

Контент-анализ - это систематическая числовая обработка, оценка и интерпретация формы и содержания информационного источника (Д. Мангейм, Р. Рич)

Контент-анализ - это качественно-количественный метод изучения документов, который характеризуется объективностью выводов и строгостью процедуры и состоит в квантификационной обработке текста с дальнейшей интерпретацией результатов (В. Иванов)

Контент-анализ состоит в нахождении в тексте определенных содержательных понятий (единиц анализа), выявлении частоты их встречаемости и соотношения с содержанием всего документа (Б. Краснов).

Контент-анализ - это исследовательская техника для получения результатов путем анализа содержания текста о состоянии и свойствах социальной действительности (Е. Таршис)

Но наиболее доступным и приемлемым определением данного метода является следующее.

Контент-анализом называют метод сбора количественных данных об изучаемом явлении или процессе, содержащихся в документах. В данном случае под документом понимается не только официальный текст, а все написанное или произнесенное, т.е. все, что стало коммуникацией.

Контент-анализу подвергаются книги, газетные или журнальные статьи, объявления, телевизионные выступления, кино- и видеозаписи, фотографии, лозунги, этикетки, рисунки, другие произведения искусства, а также, разумеется, и официальные документы.

 

.2 История появления контент-анализа

 

Известно, что методика контент-анализа нашла широкое применение именно в информационную эпоху, переживая второе рождение вместе с развитием Интернета. Однако, стоит помнить, что появился данный метод задолго до создания глобальной сети.

Ученые считают, что контент-анализ наиболее ранний систематический подход к изучению теста. В Швеции в XVIII веке был проведен анализ сборника из 90 церковных гимнов, прошедших государственную цензуру, которые после приобрели популярность, но все же были их обвиняли в несоответствии религиозным догматам.

Именно этот труд считается первым упоминаемым в литературе контент-аналитическим опытом. Для того чтобы определить соответствие догматам производился подсчет в текстах количества религиозных символов, а после сравнивался с другими религиозными текстами. Получается, что частота появления в тексте книги определенных тем служила критерием ее еретичности [13].

Все это было лишь началом для развития контент-анализа, его первыми зачатками. Если же рассматривать контент-анализ уже как полноценную методику, то следует обратиться к первым контент-аналитическим исследованиям, которые прош?/p>