他们很难用少的可怜的资源做出优秀的成果文字转WAV音频