只能看最后的结果是什么样的文字转WAV音频