还是可以尽量的模仿文字转WAV音频