Структурная схема синтезаторной микросхемы SC-01 с 22 выводами показана на рис. 7.23. В этой схеме отсутствуют сложные соединения с интерфейсом управляющего компьютера. Шесть двоичных разрядов входа используются для адресации требуемой фонемы в памяти микросхемы, а еще два входных разряда - для выбора высоты основного тона запрашиваемой фонемы. Если управляющие данные на эти входы поступают со скоростью примерно 70 бит/с, синтезаторная схема заговорит. Поскольку интегральная схема спроектирована на основе К/МОП-технологии, полный потребляемый ею во время работы ток составляет всего 9 мА. Эта особенность синтезаторной микросхемы в сочетании с совместимостью ее входов с ТТЛ-схемами делает ее идеальным устройством для сопряжения с любым персональным компьютером.
Рис. 7.23. Потоки информации в процессе работы синтезатора SC-01 фирмы 'Вотракс'. (С разрешения фирмы 'Вотракс корп.'.)
Синтезатор речи SC-01, выпускаемый фирмой "Вотракс", представляет собой полностью автономную полупроводниковую интегральную схему. Конструкция этого построенного на одной микросхеме синтезатора такова, что позволяет ему - при поступлении на его вход цепочек фонем - фонетически синтезировать непрерывную связную речь. Входящая в речевой синтезатор SC-01 микросхема имеет встроенную память на 64 различные фонемы, доступ к которым осуществляется посредством 6-разрядного двоичного кода. Надлежащим образом выбирая последовательности фонем для ввода в синтезатор, на его выходе можно воспроизвести требуемые речевые образы.
Микросхема фонемного речевого синтезатора типа SC-01 фирмы "Вотракс"
Первоначальная конструкция синтезатора Свит токер, спроектированная Стивом Сьярсиа, была описана в сентябрьском номере журнала Byte Magazine за 1981 г. Параллельный вариант схемной платы Свит токер изображен на рис. 7.22, который позволяет судить о размерах платы и простоте ее конструкции. Этот модуль синтезатора питается от источников с напряжениями +5 и +12 В. Обе схемные платы оснащены фильтрами звуковых частот и усилителями Мощности с регуляторами громкости громкоговорителей. Поскольку оба варианта синтезатора Свит токер имеют фонемное возбуждение, их словари неограниченны, что связано с возможностью соединения фонем при образовании слов.
Рис. 7.22. Плата фонетического синтезатора Свит токер фирмы 'Майкроминт'. (С разрешения фирмы 'Майкроминт инк.'.)
Синтезатор Свит токер - второе периферийное устройство для синтеза речи, выпускаемое фирмой "Майкроминт инкорпорейтид". В то время как в ее первом устройстве - Майкромаус - для генерации речевого выхода используется набор микросхем Диджитокер, в устройстве Свит токер для этой цели применяется микросхема фонетического синтеза речи SC-01A Вотракс, выпускаемая отделением "Вотракс" фирмы "Федерал скрю уоркс". Синтезатор Свит токер представляет собой небольшую печатную плату, изготавливаемую в двух форматах. Синтезатор Свит токер, предназначенный для компьютера Эппл II, подключается непосредственно в гнездо для периферийного устройства на стандартном шасси компьютера Эппл II. Вторая плата синтезатора Свит токер спроектирована в расчете на сопряжение с любым компьютером, оснащенным параллельным ТТЛ-портом. Поскольку в устройстве Свит токер используется микросхема фонетического синтеза Вотракс, в следующем разделе мы приведем характеристики этой схемы.
Синтезатор Свит токер фирмы "Майкроминт"
Рис. 7.21. Схема функционирования читающей машины KRM модели III. (С разрешения фирмы "Курцвайл компьютер продактс".) 1.Выпуклость вверх. 2. Замкнутый контур в верхней части. 3. Горизонтальная линия. 4. Вогнутость, обращенная вправо. 5. Выпуклость, обращенная влево. 6. Обучающийся блок. Запоминает вновь встретившиеся формы и проверяет правильность распознавания по шаблонам, взятым из памяти заново выученного алфавита. 7. Блок устранения неоднозначности букв. Учитывает специфические свойства: необычные пропорции, контекст, разделение букв на слова, положение строки в тексте. 8. Фонетические правила. Разделение на слоги, контекст ударения в словах. 9. Правила речеого синтеза. Преобразования фонем в сигналы управления звуковым синтезатором (сигналы отражают такие параметры, как высота основного тона, ударение, длительность, межфонемные переходы.)
Чтобы проиллюстрировать сложность процесса чтения, выполняемого машиной KRM, специалисты фирмы "Курцвайл компьютер продактс" составили блок-схему этого процесса, по которой можно легко проследить операции, реализуемые машиной. Последовательность действий, происходящих при чтении, отражена на рис. 7.21; эта диаграмма не только поясняет работу машины, но и позволяет представить, сколь сложны прикладные задачи синтеза речи. Как видно из блок-схемы, текст книги или печатный материал сканируется оптически посредством камеры и после соответствующего усиления визуальных образов преобразуется в электронные сигналы. Эти сигналы затем подвергаются обработке в соответствии с довольно сложной программой распознавания образов, которая обеспечивает идентификацию каждого считанного знака. Этот процесс настолько же сложен, как и синтез речи. После того как печатный текст преобразован в цепочки электронного "текста", перед системой возникает задача преобразования дешифрованного материала в фонемы, которые подаются в речевой синтезатор. Словарные возможности и правила фонетических преобразований, используемые в системе, довольно типичны для большинства синтезаторов, преобразующих печатный текст в речь. На выходе системы получается фонетически воспроизводимый текст, для восприятия которого требуется известный навык. Однако следует отметить, что способности этой системы в речевом воспроизведении текста поистине ни с чем не сравнимы. Эта система речевого синтеза, безусловно, преследует весьма благородные цели. Ее приложение показывает, насколько далеко ее возможности опережают возможности говорящих торговых автоматов.
Рис. 7.20. Электронные блоки читающей машины KRM модели III. (С разрешения фирмы 'Курцвайл компьютер продактс'.)
Все электронные блоки читающей машины фирмы "Курцвайл" показаны на фотографии рис. 7.20. Помимо панели управления (внизу слева) здесь изображены два блока: оптическая следящая система и электронное устройство управления оптической сканирующей системой, причем первая из них установлена на втором. Для автоматического чтения документов размером 278*356 мм в оптической следящей системе используется камера в виде линейной матрицы сканирующих элементов. Электронное устройство управления для следящей системы включает схемы, необходимые для выполнения таких операций, как сканирование, распознавание знаков и преобразование текста в последовательности фонем, из которых складывается речевой выход. Чтобы придать читающей системе большую гибкость, фирма "Курцвайл" установила на передней панели электронного устройства Управления цифровой кассетный накопитель на магнитной ленте, что облегчает ввод в систему программных средств, необходимых для работы читающей машины.
Рис. 7.19. Работа с читающей машиной KRM модели III фирмы 'Курцвайл компьютер продактс'. (С разрешения фирмы 'Курц-вайл компьютер продактс'.)
Хотя читающая машина KRM фирмы "Курцвайл" не является непосредственно компьютерным периферийным устройством и при ее проектировании такое использование не предусматривалось, эту машину можно считать важной вехой в развитии средств синтеза речи. KRM - это комбинированная интерфейсная система, состоящая из оптического читающего устройства и синтезатора речи; она предназначена в первую очередь в качестве читающего аппарата для слепых Читающая машина KRM обеспечивает прямой индивидуальный доступ к печатным и машинописным материалам слепым и людям с плохим зрением. Система KRM модели III довольно компактна и внешне напоминает стандартное множительное устройство конторского типа. Читающая машина обеспечивает фонетический синтез речи из информации, поступающей от оптической системы распознавания печатных и машинописных знаков; это наделяет ее неограниченными в словарном отношении возможностями речевого воспроизведения текста. Рис. 7.19 иллюстрирует использование машины KRM модели III. Книга укладывается на читающее сканирующее устройство считываемой страницей вниз. Система оптически отслеживает строки печатного текста и декодирует их, воспроизводя содержание книги в словесной форме. Небольшой пульт управления оснащен удобной панелью, которая дает пользователю возможность осуществлять временный останов машины, возвращаться на одну или несколько строк для их повторного прослушивания, пропускать очередные строки текста, находить нужное слово и заставлять машину произносить его. а также производить начальную установку машины в соответствии с форматом книги. На этой маленькой панели управления имеются также органы регулировки громкости, скорости чтения и высоты основного тона. Управляющее устройство размером 25*230*51 мм содержит встроенный громкоговоритель, откуда и звучит преобразованный в фонетическую форму текст.
Читающая машина фирмы "Курцвайл компьютер продактс"
Таблица 7.4. Характеристики выпускаемых формантных синтезаторов
Хотя данный метод генерации синтезированной речи используется уже довольно давно, подобные устройства по-прежнему сохраняют свою конкурентоспособность. В табл. 7.4 перечислены имеющиеся в продаже формантные синтезаторы речи. Благодаря фонемному методу синтеза возможности этих синтезаторов весьма широки. Остановимся теперь подробнее на этих средствах аналогового моделирования голосового тракта человека.
Следующую группу речевых синтезаторов составляют устройства, воспроизводящие голос человека по методу синтеза формантных частот. Поскольку эти устройства формируют свой выход не путем прямого восстановления речи, они говорят, как роботы. Однако такие устройства дают возможность пользоваться неограниченным словарем - и это очень часто отодвигает на задний план все их недостатки, связанные с неестественным звучанием речи. В частности, при определенной натренированности слушателей к восприятию фонетической формантной речи синтезатор такого типа оказываются вполне приемлемыми и могут с успехом заменить синтезаторы речи других типов.
Аналоговые формантные синтезаторы речи
Аналоговые формантные синтезаторы речи [1985 Кейтер Дж.П. - Компьютеры - синтезаторы речи]
Комментариев нет:
Отправить комментарий