他似乎更能确定文字转WAV音频