其实他一直在分析文字转WAV音频