还是主动表态了文字转WAV音频