没有给对方任何说话的机会文字转WAV音频