虽然他们已经尽量节省了文字转WAV音频