ru_tts
/
README.ru
91 строка · 6.1 Кб
1# coding: utf-8
2СИНТЕЗАТОР РУССКОЙ РЕЧИ
3
4Ru_tts - это программный синтезатор русской речи. Он выполняет полное
5TTS-преобразование, беря текстовую информацию из входного потока и
6выдавая на выходной поток оцифрованный звук в формате "raw linear
7signed 8-bit 10 kHz". Проигрыванием генерируемого звука он сам не
8занимается, нужно использовать какую-либо внешнюю программу, например,
9Sox, который можно найти в составе едва ли не любого уважающего себя
10дистрибутива Linux. Примером использования Sox для проигрывания
11синтезируемой речи может служить скрипт ru_speak. Этот скрипт можно
12использовать для немедленного проговаривания текста, поступающего на
13его входной поток. Он принимает текст в кодировке текущей локали,
14беря на себя заботы о перекодировке. Все параметры из командной
15строки передаются синтезатору как есть.
16
17Входной текст ru_tts воспринимает в кодировке koi8-r. Символы '+' и
18'=' непосредственно после гласной воспринимаются как признаки сильного
19и слабого ударения соответственно.
20
21На поведение ru_tts можно влиять посредством ключей командной строки,
22которые условно можно разделить на несколько групп.
23
24
25Параметры речи.
26
27Большинство ключей этой группы принимают в качестве аргумента числовое
28значение. Эти значения используются как множители, накладываемые на
29некий нормальный уровень соответствующего параметра. Все они должны
30быть неотрицательными. Нормальному уровню соответствует значение
311.0. Большие значения пропорционально увеличивают соответствующий
32параметр, меньшие - пропорционально уменьшают его. Диапазон изменения
33для разных параметров различен, но все значения за рамками диапазона
34приводятся к нему автоматически.
35
36-r value -- Скорость речи (от 0.2 до 5.0).
37
38-p value -- Высота голоса (от 0.5 до 3.0).
39
40-e value -- Выразительность речи (от 0.0 до 1.4).
41
42-g value -- Длительность пауз между фразами.
43Если значение непосредственно предваряется
44одним из символов ',', '.', ';', ':', '?', '!',
45то оно относится только к паузам, возникающим после
46соответствующего знака препинания. Если значение
47предваряется символом '-', то оно применяется к
48интонационным паузам, вставляемым для фразеологического
49членения длинных последовательностей слов.
50Значение без предваряющего символа накладывается
51на все паузы, пропорционально меняя их длительность.
52Разумеется, этот ключ можно использовать несколько раз,
53чтобы настроить все паузы желаемым образом.
54Нижняя граница диапазона значений для этого параметра
55всегда 0.0. Верхняя же существенно зависит
56как от типа паузы (предваряющего символа),
57так и от скорости речи.
58
59-a -- Использовать альтернативный (женский) голос.
60
61
62Интерпретация чисел.
63
64По-умолчанию и точка, и запятая внутри чисел воспринимаются как
65разделитель целой и дробной части. Но это поведение может быть
66изменено посредством ключей данной группы.
67
68-d. -- Считать разделителем только точку.
69
70-d, -- Считать разделителем только запятую.
71
72-d- -- Вовсе отказаться от интерпретации дробных чисел.
73В этом случае целая и дробная части воспринимаются как два
74отдельных целых числа, разделенных соответствующим знаком
75препинания.
76
77
78Использование словаря произношений.
79
80-s path -- Путь к словарю произношений Rulex.
81
82-l path -- Путь к файлу для сохранения не найденных в словаре слов.
83Это предусмотрено главным образом для работы над словарем
84как таковым и имеет смысл лишь при его использовании.
85
86
87Прочие ключи.
88
89-v -- Имя и версия программы.
90
91-h -- Кратенькая справочка об использовании.
92