在AI模型动辄需要数百GB显存、万亿级参数的当下,开发者HarryR通过Z80-μLM项目,让1976年问世的8位Z80处理器(仅64KB内存、无浮点运算能力)运行起对话式AI,甚至支持20问猜谜游戏。其核心优化包括:将推理引擎、模型权重及交互界面压缩至40KB文件,采用16位整数运算替代浮点运算,并应用2位权重向量化技术(每个权重压缩至{-2, -1, 0, +1},每字节存储4个权重)。项目提供两个示例:Tinychat机器人以极简风格回应问候(如“OK”表示确认、“WHY?”表示质疑),Guess则通过20个问题引导用户破解AI隐藏的谜题。HarryR坦言该系统无法通过图灵测试,但其价值在于探索AI体积下限——通过模棱两可的回复设计,迫使人类通过上下文推断或封闭式提问探测AI理解能力。
