.........
Харченко К.В. Компьютерный контент-анализ текстовой информации

Курс для студентов 1 курса специальности "Государственное и муниципальное управление" Белгородского государственного университета

 

....



Вернуться на сайт автора

На сайт дисциплины

 

Материалы к теме
Статья о логико-содержательном анализе целевых программ


Тема 1. Теоретические основы контент-анализа

1.1. Логико-содержательный анализ текста

Необходимость анализа текста состоит в том, чтобы извлечь оттуда полезную информацию, определить истинные намерения автора.

Информация оценивается по следующим характеристикам:

  • полнота – степень отражения всех вопросов, которые потребитель информации ожидает увидеть в тексте;
  • надежность – степень наличия в тексте неточных, непроверенных данных;
  • достоверность – степень наличия в тексте информации, заведомо несоответствующей действительности;
  • логичность – четкость отражения в тексте причинно-следственных связей;
  • своевременность – соответствие информации ожиданиям адресата относительно времени ее доставки.

Относительно простой метод работы с текстом – логико-содержательный анализ, при котором характеристики текста оцениваются интуитивно.

В тексте могут содержаться следующие единицы информации, которые вызывают интерес исследователя:

  • факты и оценки, особенно взятые в соотношении друг с другом;
  • эмоциональное и рациональное начала;
  • повторы, содержащие элемент внушения.

С точки зрения источниковедения выделяют внешнюю и внутреннюю критику источника.

Внешняя критика – анализ источника по формальным характеристикам, таким, как авторство, время и место создания текста, наименование документа, язык, оригинал/копия и т.п.

Внутренняя критика – анализ источника по содержательным характеристикам, важнейшей из которых является мотив создания документа.

Форма документа уже сама по себе способа порождать у исследователя гипотезы относительно особенностей его содержания. В свою очередь, по содержанию документа можно восполнить недостающую информацию относительно формальных характеристик. Так, авторство некоторого документа можно установить по стилистическим особенностям. Время создания источника зачастую угадывается по способу написания букв и т.д.

Интуитивный анализ текста, хотя и часто используется на практике, имеет свои ограничения. Как правило, читатель увлекается сюжетом, содержанием и следует логике, которую задал автор, возможно, в своих манипулятивных интересах.

Научный подход к тексту начинается с абстрагирования от содержания, принятия в расчет лишь формы. Иными словами, на основе исходного текста строится модель, каркас которой затем наполняется множеством характеристик. Моделирование позволяет вернуться к содержанию, но на более продвинутом уровне, когда становятся видны истинные намерения автора текста.

1.2. Понятие и область применения контент-анализа

Термин “контент-анализ” дословно означает “анализ содержания”. Между тем, это определение недостаточно точно, поскольку содержание текста можно анализировать по-разному, в том числе интуитивно. Более правильно будет определить контент-анализ как анализ содержания текста по формальным признакам.

Мангейм и Рич дают следующее определение: контент-анализ – это «систематическая числовая обработка, оценка и интерпретация формы и содержания информационного источника».

Из данного определения вытекают три следствия:

  • вычленение формальных признаков текста необходимо для последующей их математической обработки,
  • анализу подлежит и форма источника (т.е. размер, время и место создания, издание, в котором опубликована информация и т.д.), и содержание;
  • выражение «информационный источник» точнее, чем «текст», поскольку формальные признаки можно выделять также в аудиовизуальной информации.

Известный российский социолог А.Г. Здравомыслов назвал контент-анализ «научно обоснованным методом чтения между строк».

Автор, создавая тексты, вкладывает в них целый пласт смыслов, причем не только сознательно, но и помимо своей воли. Соответственно, с помощью контент-анализа можно получить из текста больше информации, чем желал передать автор.

Использование контент-анализа в социальных науках не ограничивается выводами относительно текста. Как правило, перед исследователем стоит задача выявить тенденцию, характерную для общества. Отсюда задачей контент-аналитика будет поиск в тексте скорее типичного, чем уникального.

Объектом изучения могут быть стереотипы – обобщенно-отвлеченные, схематизированные взгляды на мир . Стереотипы экономят познавательные усилия человека, способствуют мышлению по шаблону.

В обыденной жизни постоянно приходится принимать решения о том, каким людям и организациям верить, а каким – не верить, к чему стремиться и чего избегать. При этом обычно не проводятся сложные расчеты, а действие совершается на основе интуиции либо копирования готовых поведенческих моделей. Выявление стереотипов необходимо для того, чтобы управлять поведением больших масс людей: предотвращать стихийные разрушительные действия, подстраивать выпуск продукции под имеющийся спрос и т д. Как правило, стереотипы отражают образ мышления не простых совокупностей людей, а естественно сложившихся социальных групп (молодежь, женщины, бедные и т.д.)

Стереотипы подходят для контент-анализа лучше, чем образцы научного мышления, поскольку легче формализуются.

Контент-анализ чаще всего используется для следующих целей (по Б. Берелсону):


  • сравнение типов коммуникации в различных странах;
  • сравнение различных СМИ;
  • выявление манипулятивных приемов, определение истинных намерений участников коммуникации;
  • определение психологического состояния индивидов (например, аффективность);
  • выявление ценностей, интересов и установок субъектов;
  • выявление предметов особого внимания индивидов, групп и социальных институтов.

Основа контент-анализа – подсчет частоты встречаемости некоторых компонентов в анализируемом информационном массиве.

1.3. История контент-анализа

Систематический подход к изучению текстов стал использоваться достаточно давно. Самый первый в литературе опыт, напоминающий контент-анализ – это проведенный в Швеции ХVIII в. анализ сборника 90 церковных гимнов. В этом сборнике было подсчитано число упоминаний имени Христа и религиозных символов, а затем данные были сопоставлены с запрещенными текстами «моравских братьев». Хотя гимны прошли государственную цензуру и приобрели большую популярность, по итогам анализа они были признаны еретичными.

В конце ХIХ – начале ХХ вв. в США появились первые контент-аналитические исследования средств массовой информации. Целью исследований было продемонстрировать «пожелтение» нью-йоркской прессы (отметим имена Д. Спиида, Д. Уилкокса, Б. Мэттьюза, А. Тенни).

Факторами повышения интереса к контент-анализу стало развитие кино и радиовещания. Особенно актуальным этот метод стал в годы Второй мировой войны. Известен эпизод, когда британские аналитики предсказали время начала использования Германией крылатых ракет «Фау-1» и баллистических ракет «Фау-2» на основе анализа внутренних пропагандистских кампаний.

Классикой контент-анализа стали исследования Г. Лассуэлла в 1930-40-х гг., объектом которых стала политика и пропаганда. Лассуэлл существенно усовершенствовал процедуру контент-анализа.

К середине 50-х гг. контент-анализ стал научным методом. Исследователи стали обращать внимание не только на наличие категорий в тексте, но и на связи между категориями.

В начале 60-х гг. французский журналист Ж. Кайзер разработал целую систему изучения больших текстовых массивов, предполагающую учет расположения текстового материала, оглавления, оформления и т.д.

Дальнейшее развитие метод контент-анализа получил в трудах Э. Морен, которая ввела в научный оборот понятия «единицы информации» (ответ на вопрос «О чем говорится?»), «смысловых групп» (совокупность единиц информации), «эмоционального тона» повествования.

Начиная со второй половины ХХ в., контент-анализ широко используется в различных науках – в социологии, политологии, истории, источниковедении, культурологи, литературоведении, прикладной лингвистике и психологии.

1.4. Контент-анализ в системе методов социологического исследования

Социология, если говорить в первом приближении, – это наука об обществе.

Такое определение верно лишь отчасти. Общество является объектом социологии, равно как и объектом других общественных наук – политологии, истории и т.д.

У социологии имеется свой специфический предмет. Предметом социологии является социальное, т.е. все то, что связывает людей в обществе, организует их совместную деятельность.

Общество нельзя представить как простую совокупность индивидов. В процессе деятельности индивиды вырабатывают устойчивые отношения, устойчивые модели поведения в наиболее типичных ситуациях, регулирующие нормы и правила. Социология как раз и занимается изучением этих «надстроек», в отношении которых принято использовать понятие социального института.

Социальный институт – это исторически сложившаяся устойчивая форма безличного социального взаимодействия, реализующая определенные потребности людей в соответствии с принятыми нормами.

Структура социологии включает три части: общие социологические теории, теории «среднего уровня» (социология управления, социология образования, экономическая социология и т.д.) и конкретные социологические исследования.

В ходе социологических исследований используется целый ряд методов. Метод исследования – это обоснованный набор процедур, выполнение которых приводит к заданному результату с определенной долей погрешности. Наиболее известными методами являются следующие:

  1. Наблюдение
  2. Эксперимент
  3. Опрос
  4. Интервьюирование
  5. Фокус-группа
  6. Контент-анализ

В основе каждого метода социологического исследования лежит определенное сочетание количественной и качественной методологии.

Количественная методология применима к информации, которая может быть формализована, выражена в виде чисел.

Преимущество количественных методов – возможность выполнять математические операции над массивом данных: находить центральную тенденцию, среднее значение, складывать и т.д.

Недостаток количественных методов – числа сами по себе, без интерпретации, не могут объяснить социальные явления.

Качественная методология имеет дело со смысловыми фрагментами информации, из которой логически можно вывести следствия, например, проверить гипотезы. Качественные методы упрощают формулирование выводов по результатам исследования, однако при их некорректном использовании страдает репрезентативность – способность по части объекта судить о его состоянии в целом. Так, фрагмент одного интервью может отражать лишь субъективный взгляд одного человека, а не позицию общественного мнения.

В литературе порой присутствует подразделение методов социологических исследований на количественные и качественные. Более корректно, на наш взгляд, выделять в рамках одного метода количественный и качественный аспекты:
 

Метод

Количественная сторона

Качественная сторона

Наблюдение

заполнение карты наблюдателя

описание наблюдаемого явления

Эксперимент

подсчет изменения свойств элементов экспериментальной группы в сравнении с контрольной группой

изложение результатов эксперимента

Опрос

закрытые вопросы

открытые вопросы

Интервьюирование

подсчет количества категорий

реконструирование явления

Фокус-группа

подсчет количества высказываний по интересующей проблеме в том или ином смысле

запись транскрипта

Контент-анализ

обработка данных матрицы «случай*переменная», определение частотности смыслов, соотнесение текстовых переменных с экстра-параметрами (пол, возраст, партийная принадлежность и т.д.)

формирование выборки текстов, конструирование категорий, выявление межкатегориальных связей, поиск смыслов на пересечениях категорий

Как правило, наилучший исследовательский эффект дает сочетание методов. Место контент-анализа среди других методов социологии может быть различным:

     
  • самостоятельные исследования степени остроты социальных проблем, динамики интереса потребителей информации к тем или иным вопросам
  • предварительное, разведочное исследование, позволяющее обозначить наиболее актуальные проблемы, на основе которых затем составляются вопросы анкеты и варианты ответа
  • способ обработки ответов на открытые вопросы анкеты, углубленных интервью, записей фокус-групповых дискуссий.

     

 

 

 

 

 

     
 

Яндекс цитирования

Hosted by uCoz