Авторефераты по всем темам  >>  Авторефераты по разным специальностям Pages:     ||

На правах рукописи

Солиев Одилходжа Махмудходжаевич МАТЕМАТИЧЕСКАЯ МОДЕЛЬ ОПТИМАЛЬНОЙ РАСКЛАДКИ СИМВОЛОВ НА КЛАВИАТУРЕ И ЕЁ ПРИЛОЖЕНИЯ 05.13.18 - математическое моделирование, численные методы и комплексы программ А В Т О Р Е Ф Е Р А Т Диссертации на соискание ученой степени кандидата физико-математических наук

Душанбе - 2008

Работа выполнена в Худжандском Филиале Техлологического Университета Таджикистана.

Научный консультант: доктор физикоЦматематических наук, академик АН РТ, профессор, Усманов Зафар Джураевич Официальные доктор физикоЦматематических наук, оппоненты: профессор Комилов Файзали Саъдуллоевич кандидат физикоЦматематических наук, доцент Ашуров Абдусамад

Ведущая организация: Российско-Таджикский (славянский) университет

Защита состоится 15 октября 2008 г. в 11 ч. 00 мин. на заседании диссертационного совета К 047.007.01 при Институте математики Академии наук Республики Таджикистан по адресу:

734063, г.Душанбе, ул. Айни 299/1.

С диссертацией можно ознакомится в библиотеке Института математики АН РТ.

Автореферат разослан л_ 2008 г.

Ученый секретарь диссертационного совета Каримов У.Х.

1.

Общая характеристика работы

Актуальность темы. Проблема раскладки символов на клавиатуре возникла в 1867г., когда Ch. Sholes и S. Soule представили свое изобретение - первую в мире печатающую машинку. Раскладка, примененная ими, оказалась достаточно простой: на клавишах, сконструированных в два ряда, латинские буквы размещались в алфавитном порядке. Дефекты такого решения проявлялись в случаях скоростного печатания. При последовательном нажатии соседних клавишей соответствующие им исполнительные механизмы - молоточки с закрепленными на них литерами нередко зацеплялись друг за друга, застопоривая дальнейшую работу пишущей машинки. В последующем Ch.

Sholes, пытаясь устранить этот недостаток, предложил другую раскладку. В ней буквы, наиболее часто встречающиеся в английских текстах парами, разместились в разных местах клавиатуры. Такая раскладка, используемая и поныне, получила название QWERTY по шести первым буквам верхнего ряда клавиатуры.

Таким образом, необходимость решения проблемы раскладки впервые была инициирована конструктивными особенностями печатного механизма. Однако у этой проблемы выявилась и другая, не менее важная сторона. Дело в том, что от характера раскладки букв зависят, несомненно, удобство работы на клавиатуре и скорость набора текстовой информации. Поэтому вполне естественно было ожидать появление исследований именно в этом направлении, что и было осуществлено A. DvorakТом в 1930-х годах. Им предложена новая раскладка, в которой, с учетом частот встречаемости латинских букв в английских текстах, наиболее частые буквы были размещены в среднем ряду, менее частые - в верхнем и редкие - в нижнем рядах. Кроме того, все гласные буквы расположились в левой части клавиатуры. Результаты соответствующих экспериментов подтвердили определенные преимущества такой раскладки, однако она так и не появилась на клавиатуре пишущих машинок С изобретением вычислительных машин, а затем и персональных компьютеров, проблема раскладки вновь привлекла к себе внимание специалистов. Несмотря на то, что изучением этой проблемы на примерах естественных языков занимались многие специалисты во многих странах, удовлетворительного решения она не получила до сих пор. Причина в том, что предлагаемые решения во всех случаях опирались на качественные критерии, которые при переводе на язык количественных отношений допускали многообразные интерпретации, оставлявшие возможность последующих доработок. В настоящее время для многих языков, прежде всего с графикой на основе латиницы, реализованы версии раскладки Дворака, причем с сохранением позиций английских букв на прежних клавишах. Поскольку последнее наверняка не отвечает грамматике и статистике конкретных языков, концепцию раскладки Дворака нельзя считать безоговорочно приемлемой вследствие чего всемирная замена вариаций QWERTY на вариации раскладки Дворака не представляется разумной.

Отсутствие удовлетворительных решений проблемы способствовали, в частности, тому, что QWERTY с пишущих машин успешно перебралась и на клавиатуры компьютеров и с каждым днем все более и более укрепляет свои позиции.

Между тем проблема определения наилучшей раскладки символов на компьютерной клавиатуре не теряет своей актуальности до настоящего времени. Это подтверждается не только проектированием клавиатур для так называемых менее привилегированных языков, но также и непрекращающимися попытками совершенствования английской клавиатуры (например, работы P. KlauslerТа из фирмы Cray, США).

Настоящая диссертация, выполнявшаяся в рамках Государственной программы РТ УПрименение и развитие информационных технологий в таджикском языкеФ, а также научно-исследовательских планов Института математики АН РТ и Технологического университета Таджикистана, посвящена дальнейшему изучению рассматриваемой проблемы.

Цель диссертации - создать математическую модель оптимальной раскладки символов на клавиатуре произвольной конфигурации и затем на её основе предложить новые варианты эргономичных раскладок таджикских, русских и английских букв на компьютерной клавиатуре.

Методы исследования. Для изучения закономерностей частоты встречаемости букв в текстах естественного языка использованы методы математической статистики, программирования, СУБД и вычислительного эксперимента. Для упорядочения клавишей компьютерной клавиатуры на основе трудозатрат на их активизацию применен метод экспертных оценок. Построение оптимальной модельной раскладки, а также решение практических задач об эргономичных раскладках символов на клавиатуре основаны на развитии и применении методов линейного программирования.

Научная новизна и результаты. Основными результатами работы являются:

разработка модельной оптимальной раскладки символов естественного языка на клавиатуре произвольной конфигурации;

обнаружение того факта, что случайные выборки английских, русских текстов объемом не менее 10 страниц (приблизительно 24 000 знаков) и таджикских текстов не менее 20 страниц являются репрезентативными (R - текстами) в том смысле, что они характеризуются статистически неразличимыми распределениями частот встречаемости букв;

статистическое доказательство инвариантности ранжирования буквенных блоков по отношению к R - текстам;

получение предварительных вариантов эргономичных раскладок русских, английских и таджикских букв на компьютерной клавиатуре.

Теоретическая ценность диссертации заключается в том, что в ней предложена математическая модель для проектирования оптимальной раскладки символов на клавиатуре на основе минимизации трудозатрат при наборе достаточно длинных текстов.

Практическая ценность диссертации состоит в том, что разработанная в ней общая методика проектирования эргономичных раскладок может найти практическое применение, прежде всего, для менее привилегированных естественных языков, которые до сих пор еще не имеют собственного национального стандарта компьютерной клавиатуры.

Апробация работы. Результаты диссертации докладывались на научно-исследовательских семинарах Института математики АН РТ.

Публикации. Основные результаты диссертации опубликованы в 4-х статьях, из которых 3 статьи выполнены в соавторстве с научным руководителем З.Д.Усмановым, которому принадлежат постановки задач и обсуждение результатов. Решения задач выполнены автором диссертации.

Структура работы. Диссертация изложена на 71 страницах компьютерного набора, состоит из введения, 4-х глав, 24 таблиц, рисунков, списка литературы, включающего 44 наименования и приложений.

2. Содержание работы.

Во Введении дается обзор работ по рассматриваемой проблеме и краткая характеристика диссертации.

Глава 1. Математические основы оптимальной модельной раскладки символов на компьютерной клавиатуре.

В з 1 формулируется постановка задачи о раскладке символов по клавишам клавиатуры. Известно, что вся совокупность клавишей, формирующих компьютерную клавиатуру, разделяется на два множества, и (. Множество состоит из клавишей, предназначенных для размещения букв какого-либо алфавита, которые позволяют пользователю взаимодействовать с компьютером на конкретном языке (например, на русском или английском). Что касается клавишей множества (управляющие, цифровые, функциональные, символьные и др.), то они специализированы для выполнения процедур, не зависящих, вообще говоря, от того естественного языка, алфавит которого реализован на множестве.

При проектировании компьютерной клавиатуры под какойлибо новый естественный язык проектировщик размещает буквы алфавита на множестве клавишей, оставляя, по возможности, неизменными назначения клавишей множества. Последнее удается сделать при условии, что число клавишей множества не меньше числа букв алфавита, т.е. m. Если же, то весь алфавит не может быть размещен на множестве. В таком случае приходиться либо расширять компьютерную клавиатуру за счет присоединения к ней дополнительных клавиш, либо, если изменение не допустимо, заимствовать клавишей из множества для перепрофилирования их под буквы алфавита.

Пусть множество тем или иным образом уже приспособлено для раскладки на нем алфавита языка, т.е., по крайней мере, выполнение условия m n обеспечено. Именно в таком предположении сформулирована задача о клавиатуре.

Задача К. Разместить по клавишам множества все буквы алфавита языка таким образом, чтобы каждой клавише сопоставлялась одна и только одна буква.

В столь общей формулировке задача K, очевидно, имеет различных решений. Для того чтобы отдать предпочтение некоторым из них, требуется наложить какие-либо дополнительные ограничения на способы раскладки.

В з 2 предлагается критерий для принятия решения о выборе оптимальной раскладки символов на произвольной клавиатуре.

Пусть K - некоторая клавиатура, состоящая из n клавишей K1, K2,..., Kn, причем каждой клавише приписано некоторое положительное число ki (i 1,..., n ), указывающее количество элементарной работы, которую следует затратить для того, чтобы УактивизироватьФ (нажать на) Ki. Предполагается, что клавиши пронумерованы таким образом, что k1 k2... kn 0. (1) Пусть A - конечный набор символов a1, a2,..., an (буквы какоголибо естественного языка L и, возможно, некоторые знаки препинания), предназначенный для раскладки на клавишах множества K. Предполагается, что нам известны относительные частоты 1,2,...,n встречаемости этих символов в репрезентативных текстах (сокращенно R - текстах), написанных на языке L, причем без ограничения общности можно считать, что 1 2... n. (2) Возможные варианты раскладок будем записывать в виде подстановки n - ой степени:

, указывая тем самым, на каких клавишах размещаются те или иные символы. Здесь aKi может быть любым символом из набора A, при этом aKi aKj, если i j. Сопоставим каждому варианту количественный показатель n J (aK1, aK 2,..., aKn ) )ki, (aKi iгде (aKi ) - частота встречаемости того символа aKi, который в данном варианте приписывается клавише Ki. Этот показатель назван суммарной работой, которую необходимо затратить пользователю для набора R - текста на компьютерной клавиатуре с фиксированной раскладкой символов P(aK1, aK 2,..., aKn ).

Критерий оптимальной раскладки. Из всех возможных раскладок оптимальной является та, на которой суммарная работа J (aK1, aK 2,..., aKn )на набор R - текста достигает минимального значения.

В з 3 доказывается Теорема. В условиях (1), (2) на раскладке (3) работа, затрачиваемая на набор R - текста, достигает минимального значения, т.е. УнаилучшейФ оказывается такая раскладка, в которой Учаще встречающиесяФ символы размещаются на Уменее трудоемкихФ клавишах, а Уреже встречающиесяФ - на Уболее трудоемкихФ клавишах.

Отметим, что в диссертации приводится иное доказательство этой теоремы в сравнении с тем, которое дано З.Д.Усмановым.

В з 4 обсуждаются предпосылки применения теоретической модели для решения практических задач о раскладке символов на клавиатуре. Для этих целей требуется тем или иным способом получить конкретные числовые значения величин k1, k2,..., kn и 1,2,...,n, характеризующих элементарные работы, затрачиваемые на нажатие клавишей, и частоты встречаемости букв в достаточно длинных текстах. Однако, как следует из (3), при проектировании оптимальной клавиатуры, сводящейся, в конечном счете, к привязке каждого символа к той или иной клавише, обнаруживается, что более важной является информация о характере ранжирования клавишей и символов, нежели точные числовые значения показателей ki и i, на основе которых производится само ранжирование.

Глава 2. Ранжирование клавишей В настоящей главе осуществляется первый этап адаптации теоретической модели, предложенной в предыдущей главе, к решению задачи о раскладке символов на клавиатуре. Конкретно речь пойдет о способах определения числовых значений величин k1, k2,..., kn, характеризующих работу, затрачиваемую на однократное нажатие той или иной клавиши.

В з 1 излагаются характерные особенности Услепого десятипальцевого методаФ набора текстовой информации, положенного в основу определения величин k1, k2,..., kn четырьмя различными способами.

В з 2 дается описание 1-го способа фиксации значений ki с помощью экспертных оценок. В качестве экспертов были выбраны 20 программистов, практикующих Услепой десятипальцевый методФ набора информации на компьютерной клавиатуре. По 10балльной системе 35-и клавишам, предназначенным для размещения букв и некоторых символов, ими выставлены собственные оценки, характеризующие относительные трудозатраты на активизацию (нажатие) той или иной клавиши.

Усредненные результаты по каждой клавише приведены в таблице 1, которая представлена фрагментом компьютерной клавиатуры.

Pages:     ||    Авторефераты по всем темам  >>  Авторефераты по разным специальностям