МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ УКРАИНЫ

ДОНЕЦКИЙ НАЦИОНАЛЬНЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ

Кафедра прикладной математики и информатики

 

 

 

 

 

 

 

 

 

Реферат на тему

По курсу: «Ораторское искусство»

На тему: «автоматический синтез речевых сигналов для интеллектуализации вывода текстовой информации путем ее озвучивания»

 

 

 

 

 

 

Выполнил: студент группы ПС-07м

Деменко Д. А.

 

 

 

 

 

Донецк 2008

СОДЕРЖАНИЕ

 

ВВЕДЕНИЕ                                                                                                 

ЭССЕ НА ТЕМУ «СИНТЕЗ РЕЧИ»                                                           

РИТОРИЧЕСКАЯ ЧАСТЬ «СИНТЕЗ РЕЧИ»                                          

ОСНОВНАЯ ЧАСТЬ                                                                                   

САМООЦЕНКА РАБОТЫ                                                                         

ЗАКЛЮЧЕНИЕ                                                                                           

ЛИТЕРАТУРA                                                                                                                                                    

 


ВВЕДЕНИЕ

 

Еще с давних времен люди задавались вопросом красноречия. Как следствие, искусство красиво говорить, быстро переросло в отдельную отрасль знаний и стала одной из первых наук в истории развития человечества.

Родиной красноречия считается Древняя Греция, хотя ораторское искусство знали в Египте, Ассирии, Вавилоне, Индии. Но именно в античной Греции оно стремительно развивается, и впервые появляются систематические работы по его теории.

Начало культивирования устного слова было положено софистами, которые, будучи сами выдающимися мастерами красноречия, обучали и других этому искусству. Они основали школы, где за плату каждый желающий мог узнать правила построения речи, надлежащей манеры ее произнесения, эффектной подачи материала. Софисты принадлежали к сложившейся в Афинах во второй половине V в. до н.э. школе философов-просветителей, создавших невиданный культ слова и риторики. Они мастерски владели всеми формами ораторской речи, законами логики, искусством спора, умением воздействовать на аудиторию. Слово, речь (логос) становится объектом изучения, а риторика -„царицей всех искусств", обучение которой стало высшей степенью античного образования. Софисты постоянно подчеркивали силу слова. Но над словом следует постоянно работать, чтобы оно приобрело власть над людьми. Поэтому красноречие требует огромного труда. Протагор прекрасно это разъясняет: „Труд, работа, обучение, воспитание и мудрость образуют венец славы, который сплетается из цветов красноречия и возлагается на голову тем, которые его любят. Труден, правда, язык, но его цветы богаты и всегда новы, и рукоплещут зрители и учителя радуются, когда ученики делают успехи, а глупцы сердятся, - или, может быть, (иногда) они и не сердятся, так как они недостаточно проницательны".

В государстве рабовладельческой демократии создалась особая атмосфера для расцвета красноречия. Оно становится существенным моментом общественной жизни и орудием политической борьбы. Владеть им считалось необходимостью. Постепенно складывалось практическое направление – составление речей для нужд граждан, появлялись высказывания практиков о языке и стиле выступлений, которые послужили затем Платону, Аристотелю и другим теоретикам основой для систематизации, дальнейшего развития и углубления этих суждений, превращения их в теорию.

Искусство красиво говорить развивалось многими веками в силу своей  востребованности в высших слоях общества, и знание его было такой же необходимостью как умение считать. В нашу эпоху на первый план вышли «точные» науки. Однако, чтобы донести накопленные знания окружающим, голых цифр явно не достаточно. А если учесть скептицизм современного человека и его нежелание слушать незнакомого оратора, то умение достучаться до разума каждого индивида является очень важным личным  качеством. Поэтому актуальность ораторского искусства высока как никогда.


ЭССЕ НА ТЕМУ «СИНТЕЗ РЕЧИ»

 

         Синтез речи. Да что может быть проще скажут многие люди, которые слышали об этом, но не особо вникали в суть такого словосочетания.

А ведь проблемой синтеза речи задавались еще в XII веке, когда были предприняты попытки сделать механическую "говорящую" голову. На сегодняшний день, достижения в этой области достаточно велики. На первый взгляд, может даже показаться, что проблема синтезирования речи уже полностью решена. И действительно: нам очень часто приходится "общаться" с роботами-секретарями, бытовые приборы "обращаются" к нам на разных языках…. Однако, это не так. Ведь "говорящие" машины используют заранее предопределенный набор фраз и не могут сказать ничего, кроме того, что записано в их памяти. "Настоящие" синтезаторы речи разрабатываются еще с 80х годов ХХ века. Существуют как программные, так и аппаратные реализации, однако все они имеют серьезные недостатки и, как правило, представляют собой пародию на человеческую речь - "железный" акцент и отрывистость позволяют только догадываться о смысле текста, да и то, не всегда. Поэтому разработка синтезатора речи, "произношение" которого не возможно было бы отличить от человеческой представляется актуальной задачей.

 

 


РИТОРИЧЕСКАЯ ЧАСТЬ

 

         В ораторском искусстве существует несколько важных правил, которые напрямую воздействуют на слушателя.

Во-первых, в речи оратора необходим тезис – положение, или мысль, которую необходимо доказать, или опровергнуть оратору. Оратор не должен просто озвучивать мысли с трибуны, а обосновать их, логично подвести слушателей к желательным для вас выводам. Для овладения этим правилом ораторского мастерства нужно обладать знаниями в области формальной логики.

Форма и содержание наполняют речь смыслом и красотой. Форма и содержание, безусловно, влияют друг на друга. Они неотделимы.

Оратор также должен превосходно владеть своей тематикой, это позволит ему грамотно и уверенно излагать свои мысли. Кроме того, речь должна быть яркой, насыщенной. Речь должна запоминаться.

Для успешного выступления желательно составить план. Структура плана должна обосновывать каждое новое суждение уже обоснованным ранее. Оратор должен испытывать чувство уверенности в истинности каждого из суждений. Сперанский писал: «Одна мысль должна содержать семя другой».

Ораторское искусство можно, некоторым образом, отнести к философским наукам, однако и здесь можно выделить несколько правил и закономерностей, которые позволяют расположить к себе аудиторию, и завладеть их вниманием.

Когда аудитория незнакомая, то между  выступающим и публикой возникает стена "официальности", недоверия, которое препятствует воздействию на слушателей. Такое происходит практически всегда. Стену надо разрушить, то есть установить контакт. Хотя со временем "стена" разрушается сама, лучше убрать ее сразу. Этому помогают следующие средства контакта с аудиторией:

·        Доброжелательность, которая выражается в улыбке, доверительном тоне голоса

·        Естественность

·        Раскрепощенность

·        Разговорный стиль изложения

·        Свободные жесты и движения

 

Кроме того, нужно сохранять зрительный контакт (тем самым, проявляя заботу о слушателе). Большую часть времени надо смотреть в глаза, фиксируя взгляд, употреблять "Мы" как форму общения вместо "Я"- "Вы", потому что я - вы выражает противопоставление, а я -  мы – одно целое.

         Для оратора очень важно сохранять внимание слушателей на себе, своем докладе, если он действительно хочет донести свою информацию аудитории. Чтобы завладеть вниманием слушателей, нужно приложить немало усилий, хотя есть люди, у которых это получается абсолютно непринужденно. Они просто неосознанно соблюдают следующие правила:

·        Речь должна быть сдобрена хорошими, запоминающимися примерами

·        Речь должна быть яркой – с интонацией, эмоциональностью

·        Доклад нужно разделять Паузами. Важно делать паузы до и после главных мыслей (например, Гитлер держал паузу до 10 минут)

·        Можно вставить интересный рассказ, анекдот, любопытный факт, который должен быть конкретен (кто? где? когда?)

·        Время от времени, можно задавать вопросы слушателям. Часть информации полезно донести в виде диалога, т.к. характер монолога притупляет внимание слушателя. Когда человек слышит вопрос, он начинает мысленно отвечать на него.

·        Иногда можно заинтриговать слушателя (например, обещанием интересной мысли: «А сейчас я Вам расскажу интересный случай»), хотя такой прием часто использовать нельзя.

·        Доклад должен быть наглядным, что включает центры зрительного внимания. Это могут быть заранее подготовленные иллюстрации, презентация; рисование на доске (однако не стоит забывать, что поворачиваться спиной к залу нельзя ни в коем случае, даже если рисуешь); демонстрация на личном примере («вот, посмотрите на мой галстук…»).


 

ОСНОВНАЯ ЧАСТЬ

 

В сфере синтеза речи, на сегодняшний день, существует достаточно много направлений. Вот основные из них:

 

·        Компиляционный синтез

·        Синтез по правилам

·        Параметрический синтез речи

 

Каждый из подходов обладает своими достоинствами и недостатками. Наиболее простым представляется компиляционный синтез, который базируется на соединении "кусков" в слитную речь. Несмотря на кажущуюся простоту, метод сложен в реализации, так как в местах склейки слышны разрывы, а применение крупных кусков (слов и словосочетаний вместо слогов) в качестве фонетической базы невозможно в силу системных ограничений. К тому же, передача интонации при таком подходе очень затруднительна. При использовании параметрического синтеза, варьируя характеристики, можно осуществлять моделирование эмоциональной загрузки текста, однако избавиться от металлической окраски речи проблематично.

Параметрический синтез является более гибким, в силу параметризации на основе мелких фонетических единиц (аллофонов, дифонов, слогов…). Однако результаты, показываемые этим методом, пока далеки от совершенства во всех отношениях. На основе анализа основных методов, можно сделать выводы о существующих проблемах в области синтезирования речи [4]:

 

 

 

·        искусственность речи;

·        отсутствие эмоциональной нагрузки;

·        низкая помехоустойчивость синтезированной речи.

 

Проблема искусственности речи заключается в том, что, несмотря на кажущееся качество произношения речевых синтезаторов, такая речь воспринимается человеком с трудом. В основе технологии синтеза речи используется заранее записанная фонетическая база и слова формируются с помощью статистического расчёта по принципу максимального правдоподобия фонетической сочетаемости, а пробелы и недочеты заполняет человеческий мозг. Т.е. Достаточно качественный синтезатор с хорошо подобранной фонетической базой будет прекрасно восприниматься на слух в течение 15 - 20 минут, но потом абсолютное большинство людей перестаёт воспринимать смысл того, что произносится. Происходит это из-за того, что для прослушивания синтезированной речи используются дополнительные центры обработки головного мозга, и мозг просто устает.

Таким образом, головной мозг не воспринимает синтезированную речь как естественную, которая сразу обрабатывается в речевом центре. Подобный эффект многие испытывали на себе, изучая иностранный язык. Следующей проблемой является отсутствие эмоциональной нагрузки - личного восприятия произносимого текста читателем. Когда текст читает человек, он поневоле пропускает смысл воспроизводимого через себя, и в интонациях и нюансах чувствуется его отношение к воспроизводимому.

Современные программы этого не могут, но самые передовые из них пытаются имитировать интонацию путем модуляции тембра, длительности фонем и пауз. Но это тоже всего лишь подражание, поэтому мозг быстро устает исправлять огрехи воспроизведения, и слушатель теряет нить повествования. Очевидно, для решения этой задачи требуются методы из области теории искусственного интеллекта для "извлечения смысла" из воспроизводимого текста. Поэтому такие синтезаторы должны строиться с учётом результатов междисциплинарных исследований

 

Третья проблема - низкая помехоустойчивость синтезированной речи. Как показали и показывают эксперименты, достаточно лишь небольшого шума, чтобы слушатель перестал воспринимать смысл текста, произносимого синтезатором. Объяснение этому также находится в области нейрофизиологии. Т.к. Для обработки синтезированной речи головной мозг использует дополнительные центры, то при наличии постороннего шума, разговора или необходимости выполнения слушателем какой-то работы, мозг просто не справляется ("перегружается"), и человек перестает понимать смысл произносимого. Эффект помех существенно ограничивает возможности применения синтезатора в реальных условиях техногенных и природных шумов[3].

 

        


САМООЦЕНКА РАБОТЫ

        

         Оценивать объективно личный труд  достаточно сложно. Все затронутые темы кажутся раскрытыми, а все мысли – законченными. Однако даже тот факт, что я еще не окончил свое обучение говорит об обратном.

         В реферате рассмотрен основные подходы к синтезу речи, все основные аспекты, с ним связанные в легко читаемой, доступной форме. Однако  доклад абсолютно не представляет конкретных алгоритмов, описание методов формализированы и по ним невозможно написать хоть какой-нибудь программы, что говорит о неполноте документа.

         В риторической части представлено краткое «руководство» для оратора. Его сложно назвать полным из-за отсутствия описания такой важной части ораторского искусства, как жестикуляции. Кроме того, риторическая часть оформлена в «сухом» научном стиле, что не способствует восприятию материала. Однако, по моему субъективному мнению, материал все-таки позволит не «стушеваться» и достойно выступить неопытному оратору.

          


ЗАКЛЮЧЕНИЕ

 

Самые перспективные решения в области синтеза речи сегодня базируются на статистических моделях, параметры которых просчитываются по аннотированной тексто-фонетической базе данных.

Идеальным вариантом для учета многофакторной природы этого просодического феномена, является такая база данных, которая содержит информацию, статистически значимую по объему, а список учитываемых параметров по возможности расширен и включает все значимые факторы (смысловой, синтаксический, фонетический, пунктуационный).

Как основа дальнейшей разработки, можно посоветовать подход, основанный на сочетании методов компилятивного синтеза и формантного синтеза по правилам, который может быть положен в основу построения системы синтеза речи по тексту с контекстно-зависимой грамматикой как части канала голосового управления.


ЛИТЕРАТУРА

 

1.       Анисимова Т. В.     Современная деловая риторика: Учеб. пособие / Т. В. Анисимова, Е. Г. Гимпельсон. — 2-е изд., стер. — М.: Издательство Московского психолого-социального  института;  Воронеж: Издательство НПО «МОДЭК», 2004.

2. Баева О.А. Ораторское искусство и деловое общение: Учебное пособие. – М.: Новое знание, 2000

3. Д. Карнеги. Как завоевать друзей и оказывать влияние на людей, -М, 1994

4. Галунов В.И. Помехоустойчивость как системообразующий фактор речи. Проблемы и методы экспериментально-фонетических исследований. – СПб, 2002. – 327 с.

5. Синтез русской речи. – http://www.napravlenie.ru/site.xp/052051049.html

6. Вокодеры и синтезаторы речи. – http://www.3dnews.ru/multimedia/vocoder