或许他的推断也是错误了文字转WAV音频