他们自身的文本创作能力非常匮乏文字转WAV音频