也不能确定自己看到的和听到的文字转WAV音频