但却是直接从零开始计数文字转WAV音频