在第三层增加了十倍文字转WAV音频