最多也就是二流乃至是三流编剧的水准文字转WAV音频