他们的质疑皆是减小大半文字转WAV音频