为应对云端AI服务的高昂成本,播客应用Overcast的开发者Marco Arment自建了一个由48台Mac mini组成的服务器集群。他利用Apple Silicon芯片的优势,在本地运行语音识别模型,尽管前期硬件投入较大,但后续运营成本相对可控。在转录过程中,Mac mini集群的分布式架构提高了效率。播客分发时,Marco采用音频指纹识别和去重技术,解决了转录对齐的难题,确保了转录的一致性,避免了重复计算,为类似业务提供了应对高昂云端服务费用的可行方案。