结果发现人家不但能听懂文字转WAV音频