从那两个人的影子可分辨出文字转WAV音频