他们的一切行动肯定都是围绕这个进行的文字转WAV音频