Создание приложения "Подсчет частоты введенных слов в текстовом файле"

Курсовой проект - Компьютеры, программирование

Другие курсовые по предмету Компьютеры, программирование

Оглавление

 

Введение

Анализ предметной области

Проектирование

Блок-схемы

Отладка и тестирование

Сопровождение

Заключение

Список литературы

Приложение

Введение

 

В настоящее время человечество является высокоразвитым обществом с множеством технологий упрощающими жизнь в той или иной степени. Перед обществом, как и раньше, могут встать различные важные проблемы, для решения которых необходим сбор статистических данных (например, социологических опрос).

Статистическое исследование, как и любое другое исследование, может играть очень важную роль в науке или в какой-либо другой области. Статистическое исследование позволяет людям предусмотреть возможные разрешения различных ситуаций, возможно даже, на основе предыдущих исследований.

С помощью его можно решать очень большой круг вопросов и задач, анализируя полученные данные и давая конкретные рекомендации для разрешения проблемы.

Таким образом, роль социологического исследования в процессе изучения общества трудно переоценить, поэтому именно оно и будет рассмотрено в данной курсовой работе на примере разработки приложения Подсчет частоты введенных слов в текстовом файле.

Данная программа может использоваться в филологических исследованиях текстов больших объемов. С её помощью можно узнать, как часто применяется то или иное слово в тексте, таким образом составляя статистику использования того или иного слова. Таким образом, программе можно найти применение в области лексической семантики.

Одна из целей исторического метода лексической семантики отличить исконные слова от заимствованных и установить время, причину заимствований и их роль для развития данного языка. С синхронической точки зрения для многих слов это сделать довольно трудно, а часто и невозможно, тогда как при историческом подходе генетическая связь между родственными словами, а также источник заимствований чужих слов и выражений становятся очевидными и аргументированными. Одним из важных критериев древности слова служит частота его использования в языке: чем чаще слово, тем оно древнее.

Согласно некоторым исследования при чтении, правильно выбрав и хорошо запомнив около 80 наиболее обычных, самых частотных слов, можно понять около 50% простого текста;

200 слов покроют примерно 60%;

- 300 слов - 65%;

- 400 слов - 70%;

- 800 слов - примерно 80%;

- 1500 - 2000 слов - около 90%;

- и 8000 слов покроют практически около 99 процентов письменного текста.

Очевидно, что статистику собранную программой для каждого конкретного текста можно применить в соответствии с результатами исследований.

Для реализации поставленной цели можно выделить несколько пунктов:

)Выделить возможные области применения приложения и разобраться в возможных аспектах и особенностях найденных областей применения;

)Составить алгоритм работы приложения;

)Разработать приложение на языке программирования Си;

)Протестировать приложение;

)Устранить возможные ошибки в работе приложения;

)Составить описание работы с приложением для пользователей.

Разбор областей применения приводится в разделе Анализ предметной области, алгоритм работы приложения представлен в виде блок-схем функций программы. По третьему пункту приводится исходный код программы с подробными комментариями. Тестирование приложения представлено в виде скриншотов консоли и содержимого текстовых документов.

После тестирования приводится подробная инструкция работы с консольным приложением для пользователей.

Финальный вариант приложения предназначен для людей, работающих в лингвистических и филологических направлениях.

В работе использовано 4-ре источника литературы, основным из них является Программирование на языке Си (Подбельский В.В., Фомин С.С. 2004. - 600 с.: ил)

Работа состоит из 4-х частей.

В первой части производится анализ предметной области;

Во второй описывается проектирование приложения;

В третьей приводятся результаты тестирования приложения;

В четвёртой части находится описание работы с приложением.

Анализ предметной области

 

При анализе данной области было выделено 3 возможных варианта приложений, с помощью которых можно реализовать полностью или частично поставленные задачи.

Сначала рассмотрим варианты приложений с частичной возможностью реализации поставленной задачи:

)Любой текстовый редактор с функцией поиска по словам.

Примером данного приложения может служить Microsoft Word 2010(Рис №1)

 

Рис №1. Окно поиска Microsoft Word 2010

 

Из минусов данного решения можно отметить, что данный способ является очень затратным по времени, так как одновременно можно получить частоту только для одного слова.

)Браузер со встроенной поддержкой поиска на странице.

В качестве примера рассмотрим браузер Google Chrome(Рис №2)

 

Рис №2. Окно поиска Google Chrome

 

Минусами такого способа являются:

Поиск только по одному слову одновременно;

Необходимость переноса текста в txt- или html-формат;

Поиск лишь по буквенным сочетаниям.

В качестве примера приложения, на котором можно реализовать поставленные задачи полностью рассмотрим LitFrequencyMeter(Рис №3,№4,№5):

Данная программа позволяет определить число слов и знаков в тексте, сделать выборку для анализа, исключив отдельные знаки и союзы, и определить число выбранн