通过刚才我们看到的事情来分析文字转WAV音频