我按照他的猜测仔细推演了一下文字转WAV音频