毕竟在他们的认知里文字转WAV音频