47年前的6MHz电脑跑AI 纯汇编语言3.5分钟达成 100%准确率
6 小时前

前Windows核心开发者Dave Plummer在一台47年前的PDP-11/44计算机上,利用6MHz CPU和64KB内存,成功运行了仅含1216个参数的单层单头Transformer模型ATTN-11,该模型由Damien Boureille用PDP-11汇编语言编写,在约350个训练步骤后达到了100%准确率,整个过程耗时约3.5分钟。