国外的学者其实也是一般的情况文字转WAV音频