是没有办法约束观众的文字转WAV音频