虽然相比记忆的总量文字转WAV音频