现在的局面和他推测的差不多文字转WAV音频