当然嘴上还是非常强硬的表达着文字转WAV音频