Книги по разным темам Pages:     | 1 |   ...   | 75 | 76 | 77 | 78 | 79 |   ...   | 82 |

В работе используются результаты фонетических и морфологических свойств и характеристик для анализа украинской речи.

332 Intelligent Systems Объектом синтеза будем рассматривать слово в связи с тем, что в описанной задаче озвучивания произвольной текстовой (словесной) информации минимальным семантически полным носителем информации является именно слово. Это подсказывают и результаты фонетических исследований [Кривонос, 2006].

Акустические характеристики гласных слова и соотношение гласных под ударением и безударных значительно отличается от соответствующих показателей слов изолированных. Поэтому следует дифференцировать ударение организованное изолированным словом, и ударение слова в предложении, т.е. фразовое ударение [Ющук, 2004].

В данной работе предлагается общая структура представления объектов синтеза, их свойств и характеристик.

1. Общие грамматические характеристики слова, отображающие правила его написания и пр.

2. Наборы гласных, согласных, йотированных, смягченных звуков, мягких знаков, апострофов и их количество, соответствующие слову. Эти характеристики позволят описать (а при построении модели синтеза и использовать) фонетические свойства звуков речи. Так, известно, что:

Ц произношение гласных зависит, прежде всего, от позиции в слове и их артикуляционных характеристик и в незначительной мере от соседства с теми или другими согласными звуками;

Ц произношение согласных зависит от звукового окружения и предопределяется их артикуляционными характеристиками.

4. Набор элементов синтеза составляющих слово. Это могут быть как классические элементы синтеза (фоны, слоги, дифоны, трифоны), так и какие-то другие, выбранные специально для конкретной системы озвучивания. Элементы синтеза, в свою очередь, обладают рядом свойств и характеристик, которые будут рассмотрены далее.

5. Набор времени звучания элементов синтеза и общее время звучания слова. В естественной речи каждое слово и его составляющие (в задаче синтеза речи это элементы синтеза) имеют строго определенное время звучания и для естественности звучания это следует учитывать.

6. Набор звуковых файлов определенного размера содержащих элементы синтеза. Выделение и использование данных сведений направлено на анализ и оптимизацию работы с оцифрованными звуковыми речевыми сигналами, возможностью упрощения их перекодирования в разные цифровые форматы звуковых данных.

7. Частотные характеристики использования слова в речи и частотные характеристики элементов синтеза для данного слова.

Существует несколько стандартных подходов к выбору концепции формирования элементов синтеза:

выбор фонов, дифонов, слогов и трифонов.

Поскольку в естественной речи не все звуки являются вокализированными, то часто используют гибридный дифонно-силябулярный конкатенативный синтез, где часть элементов является дифонами, а часть - слогами [Hess, 1992].

Для конкатенативных систем с практически всеми (кроме фонов) фонетическими единицами в качестве минимальных элементов синтеза характерно присутствие вспомогательных единиц, таких как начальные и завершительные полуфоны - акустические эквиваленты начальных и завершительных частиц фонем.

Таким образом, выбор элементов синтеза представляет собой сложную задачу, требующую тщательных языковедческих исследований. Так, следует учитывать большое количество фонетических коартикуляционных свойств элементов речи (следовательно, элементов синтеза речи), в частности таких как:

Ц произношение гласных в зависимости от их расположения в слове;

Ц ударение гласных;

Ц акустические особенности и характеристики гласных изолированных, в слове и в предложении;

Ц произношение согласных в зависимости от их расположения в слове, смягчение, удвоение и пр.;

Ц влияние акцентированности и ударения на частотные характеристики речи;

Ц движение и характеристики частоты основного тона;

Ц суперсегментные явления;

XII-th International Conference "Knowledge - Dialogue - Solution" - структуризацию пары лобъект синтеза - элемент синтеза;

Ц просодию, средства просодии и просодические характеристики;

Ц интонационные свойства естественной речи9 и пр.;

Для учета выше перечисленных свойств в данной работе предлагается следующее общее структурное представление элемента синтеза как составляющего системы озвучивания речи.

1. Текстовый вид элемента синтеза - совокупность текстовых элементов синтеза (это могут быть фонемы, дифоны, слоги, трифоны и пр.) должна формировать полную выборку слов [Кривонос, 2005].

3. Цифровой звуковой сигнал, содержащий элемент синтеза. Записанную звуковую информацию следует хранить с высоким качеством в удобном для последующей обработки формате цифровых звуковых данных. Также необходимо провести фильтрацию избыточной информации сигналов и нормализацию звуковых элементов синтеза. Это принципиально повысит качество естественности звучания и разборчивость синтезируемой речи.

4. Тип элементов синтеза. Согласно предварительным фонетическим и морфологическим исследованиям, необходимо провести строгую типизацию элементов синтеза по таким характеристикам:

Ц расположение в слове;

Ц ударность / безударность гласного звука элемента (если присутствует);

Ц свойства согласного звука элемента (если присутствует);

Ц сегментные свойства согласных и пр.

5. Время звучания элемента синтеза. На этапах создании и использовании звуковых элементов синтеза следует учитывать время звучания элемента при произношении их диктором в естественных условиях.

6. Звуковой файл, содержащий элемент синтеза. Выделение и использование данных сведений направлено на создание статистических данных о конкретном элементе и базы всех элементов синтеза.

7. Фонетические, морфологические и акустические сведения об элементах синтеза.

Особое внимание следует уделить исследованиям фонетических, морфологических, коартикуляционных, интонационных, просодических свойств речи для их использования при построении систем озвучивания информации.

Заключение Рассмотрена задача создания систем озвучивания информации, поданной в текстовом виде - посредством конкатенативного Text-to-Speech синтеза. Для этого выполнен обзор основных этапов проблемы, выделение и анализ основных подзадач. Описаны особенности такого подхода относительно решения проблемы - простота концепции, высокий уровень естественности звучания синтезированной речи, высокая скорость работы систем конкатенативного синтеза. Исследованы фонетические свойства и характеристики синтезируемой речи. Предложено структурное представление объектов и элементов синтеза. Проведен анализ их структуры, свойств и характеристик. Акцентирована необходимость анализа интонационных и просодических характеристик украинской речи для задачи синтеза речи. Уделено внимание большому количеству проблем, связанных с фонетическими коартикуляционными свойствами элементов речи.

Библиография [Dutoit, 1993] Dutoit and Leich H. MBR-PSOLA: Text-to-speech synthesis based on an MBE re-synthesis of the segments database // Speech Communication. - [Cox, 2000] Cox R.V., Kamm C.A., Rabiner L.R., Schroeter J. Wilponl J.G. Speech and language processing for next-millennium communications services // Proc. Of the IEEE. - 2000. - 88, N. 8.

[Hess, 1992] Wolfgang Hess Speech synthesis - a solved problem // Signal Processing VI. - 1992. - P. 37Ц46.

[W3C] Теоретическое и практическое значения интонации как формулирующего элемента и структурного компонента звуковой речи является очень важным. Интонацию определяют как фразовую фонетику, синтаксическую фонетику, как суперсегментный уровень речи; менее распространенным есть ее определение как ритмомелодики и просодии [Багмут, 2004].

334 Intelligent Systems [Багмут, 2004] Багмут А. Укранська нтонологя: проблематика дослджень // Укранське мовознавство - К.: Нацональний унверситет мен Тараса Шевченка, 2004. № 32Ц33. - С. 36Ц[Крак, 2005] Крак Ю.В., Шатковський М.М. Сегментаця мовно нформац для задач автоматичного озвучення // Всн.

Кивськ. ун-ту. Сер. фз.-мат. наук. - К.: Нацональний унверситет мен Тараса Шевченка, 2005 - Вип. 4. - С. 254-258.

[Кривонос, 2005] Кривонос Ю.Г., Крак Ю.В., Шатковский Н.Н. Анализ структуры задачи создания систем озвучивания текстовой информации // Компьютерная математика, 2005. - № 3. - С. 87Ц[Кривонос, 2006] Кривонос Ю.Г., Крак Ю.В., Шатковский Н.Н. Структура, свойства, характеристики объектов и элементов синтеза речи // Компьютерная математика, 2006. - № 1. - С. 61Ц[Ющук, 2004] Ющук . Фонетичн закони й орфоепя // Укранське мовознавство. - К.: Нацональний унверситет мен Тараса Шевченка, 2004. № 32Ц33. - С. 16ЦИнформация об авторах Кривонос Ю.Г. - Институт кибернетики В.М.Глушкова НАН Украины, зам. директора, 40, пр-кт Академика Глушкова Киев-03187, Украина, e-mail: aik@public.icyb.kiev.ua Крак Ю.В. - Национальный университет имени Тараса Шевченко, профессор, 6, пр-кт Академика Глушкова Киев-03187, Украина, e-mail: krak@unicyb.kiev.ua Шатковский Н.Н. - Институт кибернетики В.М.Глушкова НАН Украины, м.н.с., 40, пр-кт Академика Глушкова Киев-03187, Украина, e-mail: nicolo@icyb.kiev.ua FINDING OF INFORMATIVE PARAMETERS DESCRIBING BIOMEDICAL POPULATIONS Mykola Budnyk, Igor Voytovych Abstract: Problem of>

Keywords: diagnostic test, generalized parameters, binary decision rule, risk zone, fuzzy logic.

ACM>

Introduction Problem of>

Solution of this problem within particular application area consists in synthesis of appropriate Decision Making Algorithm (DMA). Specific features of BioMed (more generally - living) population is that it is formed by elements of statistical nature. Therefore, characteristics of probability distribution function (PDF) with respect to any experimentally observed parameter are essentially influenced by many another external non-informative factors.

As a result, wide blurring, asymmetry, excess, up to non-unimodal form, i.e. differences of empirical PDF from gauss-like form are take place. All that do generating of reliable BioMed DMAs are very difficult, because above factors are, in fact, the disturbed degree of freedom which are equivalent to strong external noises in physical sciences.

XII-th International Conference "Knowledge - Dialogue - Solution" The quality of group discrimination is determined primarily by the quality of describing parameters. Therefore, the search for informative (diagnostically significant) parameters, i.e. identification of populations, is crucial. Basic hazards, for instance, of ischemic heart disease (IHD), are posed by sex, age, genetic factor, hypercholesterolemia, arterial hypertension, smoking habits, excessive body weight, and inactive lifestyles. They may cause directed effect that shifts informative parameter towards IHD, which ultimately will bring about asymmetry in PDF.

Other PDFТs deviations from Gauss form may also be caused by УuncompensatedФ impact of external factors.

1. Figures of Merit (FOM) of Medical Test Diagnostic value is determined generally by such 4 indicators as Specificity (Sp), Sensitivity (Sn), Negative prognostic value (NPV), Positive prognostic value (PPV), yet depending on applications (screening, diagnosing or evaluation of treatment effectiveness) a certain index is decisive. Here is considered the simplest and the most practiced case of the one-dimensional parametric (sample) space when division is made with just a single parameter, and the simplest threshold Decision Rule (DR) dividing a group by two - negative and positive>

Negative>) Х CR Binary DR (X )= (1) CR Positive> (<) Х CR Assume the objective is to divide a group of persons consisting of samples of healthy individuals N in number A and patients N in number by two - positive and negative>

A B Sp=1Ц, Sn=1Ц, =d/ N, =c/ N, NPV=С/(С+n), PPV=Ч/(Ч+/n), n=p/(1Цp), p=N /N. (2) A B B Sn and Sp demonstrate a probability of attributing persons to a УtrueФ>

From (2) it is seen a major failure of inverse DPS by means of> Pages:     | 1 |   ...   | 75 | 76 | 77 | 78 | 79 |   ...   | 82 |    Книги по разным темам