同样也需要站在其他人的角度文字转WAV音频