不过他们的担心的确是有些多余文字转WAV音频