Повышение эффективности работы опечаточника
Информация - Компьютеры, программирование
Другие материалы по предмету Компьютеры, программирование
?ого параметра проводим эксперимент.
Для каждого эксперимента строим так называемый характеристический вектор (на основании данных, содержащихся в выходном файле с общим описанием результатов для эксперимента)
Структура характеристического вектора:
[1,1]right/allall]*(-1)[1,2]*(-1)[1,3] *(-1)right-[1,1]-[1,2]-[1,3]time*(-1)
)Сортируем полученные характеристические вектора в соответствии с лексикографическим порядком по невозрастанию.
В результате получаем относительный порядок для значений исследуемого параметра (наилучшим считается то значение параметра, характеристический вектор которого находится на первом месте в отсортированном массиве данных векторов).
Для наиболее наглядного изучения можно построить графики зависимости относительной эффективности исследуемого параметра от его значения. По оси абсцисс отложим значение параметра, а то оси ординат его относительную эффективность. Для того чтобы получить относительную эффективность параметров необходимо в уже отсортированной последовательности, каждому значению характеристического вектора поставить в соответствие
целое число = N - n ,
где N-количество разбиений параметра, а n порядковый номер вектора в отсортированной последовательности.
Для наиболее полного исследования параметра необходимо повторить данные действия, выбирая другие значения не исследуемых параметров. После этого на основании всех проведенных серий экспериментов, можно сделать выводы о выборе оптимального параметра.
После этого данный параметр считается исследованным, а его значение при исследовании других параметров выбирается уже не произвольным, а равным выбранному.
Данные действия необходимо повторить пока все параметры не будут исследованы. В итоге мы получим список оптимальных параметров.
Библиография
1.Damerau, F.J. A technique for computer detection and correction of spelling errors
2.Justin Zobel, Philip W. Dart : Phonetic String Matching: Lessons from Information Retrieval // SIGIR 96 Proceedings of the 19th annual international ACM SIGIR conference on Research and development in information retrieval, 1996
.Justin Zobel, Philip W. Dart : Finding Approximate Matches in Large Lexicons // Software-Practice & Experience, Volume 25 Issue 3, March 1995
4.Карпенко М. П., Протасов С. В. Некоторые методы очистки словаря запросов поиска