他并没有用最直接的方法去确定文字转WAV音频