还是任由这两人经过文字转WAV音频