他也不会直接承认文字转WAV音频