说话声是不会往周围传太远的文字转WAV音频