从一开始他就把这一切考虑进去了文字转WAV音频