由于操作者的主要目的是练习文字转WAV音频