他们还是更加重视彼此之间的配合文字转WAV音频