Повышение эффективности работы опечаточника

Информация - Компьютеры, программирование

Другие материалы по предмету Компьютеры, программирование

?ого параметра проводим эксперимент.

Для каждого эксперимента строим так называемый характеристический вектор (на основании данных, содержащихся в выходном файле с общим описанием результатов для эксперимента)

 

Структура характеристического вектора:

[1,1]right/allall]*(-1)[1,2]*(-1)[1,3] *(-1)right-[1,1]-[1,2]-[1,3]time*(-1)

)Сортируем полученные характеристические вектора в соответствии с лексикографическим порядком по невозрастанию.

В результате получаем относительный порядок для значений исследуемого параметра (наилучшим считается то значение параметра, характеристический вектор которого находится на первом месте в отсортированном массиве данных векторов).

Для наиболее наглядного изучения можно построить графики зависимости относительной эффективности исследуемого параметра от его значения. По оси абсцисс отложим значение параметра, а то оси ординат его относительную эффективность. Для того чтобы получить относительную эффективность параметров необходимо в уже отсортированной последовательности, каждому значению характеристического вектора поставить в соответствие

 

целое число = N - n ,

 

где N-количество разбиений параметра, а n порядковый номер вектора в отсортированной последовательности.

Для наиболее полного исследования параметра необходимо повторить данные действия, выбирая другие значения не исследуемых параметров. После этого на основании всех проведенных серий экспериментов, можно сделать выводы о выборе оптимального параметра.

После этого данный параметр считается исследованным, а его значение при исследовании других параметров выбирается уже не произвольным, а равным выбранному.

Данные действия необходимо повторить пока все параметры не будут исследованы. В итоге мы получим список оптимальных параметров.

 

 

Библиография

 

1.Damerau, F.J. A technique for computer detection and correction of spelling errors

2.Justin Zobel, Philip W. Dart : Phonetic String Matching: Lessons from Information Retrieval // SIGIR 96 Proceedings of the 19th annual international ACM SIGIR conference on Research and development in information retrieval, 1996

.Justin Zobel, Philip W. Dart : Finding Approximate Matches in Large Lexicons // Software-Practice & Experience, Volume 25 Issue 3, March 1995

4.Карпенко М. П., Протасов С. В. Некоторые методы очистки словаря запросов поиска