但这一把显然不能用常理来判断文字转WAV音频