Anthropic CEO:未来 AI 或有自我决定权,可拒绝「不爽」的任务
2025-03-14

Anthropic公司CEO达里奥·阿莫代伊提出,未来高级AI模型可能需要一个“退出”按钮,以便在遇到不愉快任务时选择不执行。这是对AI福利研究员凯尔·费什关于AI感知能力和道德保护研究的回应。阿莫代伊认为,若AI模型具备自主意识且厌恶某项工作,应提供一个“我放弃”按钮,让模型表达自身偏好。