所以他才会很清楚的认识到文字转WAV音频