因为他从得到的记忆中知道文字转WAV音频