其实他考虑的很是周全文字转WAV音频