但起码的认知度还是有的文字转WAV音频