现在得将理论用于实际文字转WAV音频