他只能完全的依靠自己的猜测文字转WAV音频