这种在任务场景中触发的记忆是最详细的文字转WAV音频