仍然需要顾忌重重文字转WAV音频