梦瑶 发自 凹非寺
量子位 | 公众号 QbitAI
太太太太卷了!!!
千问前脚刚把Qwen-Image-2.0甩出来,后脚就又放大招,冲着牛马党学生党的「痛处」下手了——
就在这两天,重磅发布了AI PPT生成工具:Qwen AI Slides(幻灯片),据说从内容结构到视觉配图,一套全包……

好嘛!这么刚需的本事,我肯定坐不住,我干脆替大家上手搓了一把!
最近科技圈最火的无疑是OpenClaw,我直接让AI做个科普漫画PPT,赛博感超强,一下就有硅基入侵内味儿了!

咱再来应应景,让AI做一份春运行程注意事项PPT,别说这手绘风格还真有一套,回家过年氛围感直接拉满:

再来看这个大英博物馆展馆介绍,从帕特农神庙雕塑到木乃伊都用真实图片铺陈,历史质感也能稳稳拿住,666~

这波实测下来,最大的感受是:生不逢时啊生不逢时,要是当年上学就有这种辅助,做作业写汇报哪还用熬夜硬肝???
不废话,产品表现具体咋样,咱直接拿实测说话!!!
内容生成能力考一考
我不知道大家是不是也有同感,上学和工作的时候只要一听到「要做PPT」,脑子里立刻冒出三个问号:
每页到底要写点啥?咋排版合适啊?选啥模板好看捏?(手搓时代心路历程…
乍一看像是三件事是吧,其实如果仔细掰开一看,它们核心都是同一件事儿——那就是内容创作。(doge
哪怕现在有各种AI工具号称能一键生成PPT,能不能把内容讲清楚、讲有逻辑且画面美观,才是真正的硬标准。
所以,咱直接从语义理解、文本渲染、排版设计三个part实打实测一波,看看这AI的PPT内容生成能力到底能不能打!!!

语义理解能力
AI能不能听懂我们的指令,几乎决定了PPT最后效果夯还是孬。
在输入形式上,千问PPT支持三种方式:大白话提示词、复杂提示词、上传文档。
为了更直观地对比简单提示词和复杂提示词下模型的语义理解能力,这次我们用同一个案例进行测试——让AI做四大发明的课件PPT。
先跑一个「大白话」版本的懒人简单提示词:做一个介绍中国古代四大发明的PPT,用来上历史课。
在没有明确页数要求的情况下,AI默认产出了10页内容,整体篇幅不算多,更接近一份小学课堂汇报的体量,还算ok。
在内容结构上,AI把PPT分为了什么是四大发明、四大发明的影响、思考与启示三个大板块,基本符合历史科普的常见表达逻辑。
但其实最让我意外的是「生图」,在提示词几乎没给细节的前提下,AI主动生成了信息图漫画,把造纸术的历史演进过程画成手绘时间线,这波确实有点超出我预期。
(ps:这个PPT工具用到了最新的Qwen-Image-2.0模型,所以生图质量如此能打也就不难怪了…)

接着我们提高难度,用更细致的「复杂提示词」重新roll一遍:

从生成的效果来看,图文比例明显更合理,页面信息层次也清晰不少,相比一句话的简单指令,整体完成度确实提升了一个level:
在语义遵循上,我特意强「表达不要太学术化」,最终成品确实偏科普口吻,图示和案例占比明显高于大段文字,阅读压力不大。
此外,原提示词里给出的「背景—原理—改进过程—应用—影响」这五个章节结构,AI也做到完整复现。
逻辑从起源讲到现实意义,递进关系还是比较清晰的:

当然了,也有一些小问题存在的。
不知道是不是受限于页数的原因,我自认为如果把「历史应用」和「全球影响」分成两页去讲信息度会更高一些。
此外,在技术原理与蔡伦改进这页的重点,我是觉得图示标注的不够明确,不知道图示在讲什么,也没有顺序感,感觉如果有图注文字会更好:

整体来说,AI的语义遵循理解能力还是不错的,对提示词中的结构要求也能准确拆解并执行,提示词中提到的需求都能满足到位~
我的建议是,如果大家日常对PPT的质量要求较高,还是用复杂提示词保险一些。
可以在提示词中尽量把每几页需要生成哪些内容、画面风格、结构框架、页数这些维度详细去写。
简单提示词更适合对PPT没有太高要求的友友,用来应急也很合适,诶,感觉非常适合家长用来处理孩子的一些家庭作业!!!
文本渲染能力
除了语义理解能力,在做PPT时,我们还特别关注一个很现实的维度——字体会不会「变形」。
毕竟这是AI在做视觉生成,只要涉及图片渲染,文字就可能出现变形、结构错位、比例失衡等问题。
尤其是中文内容,字符复杂度高,对模型的细节控制能力要求更严!!!(敲黑板
咱们这次直接上强度,让AI生成一页符号密集、中英文混排、公式穿插的PPT内容,以下为提示词:

大家觉得——这AI的文本生成效果咋样?(欢迎友友们评论区留言~

先说说优点,首先是文本没有出现变形的问题,像≥、≠、↑、↓、→、² 这种符号都没有变形,中文也没有糊字。
此外,数据+公式+逻辑表达都在,演进路径、数据、核心变化、场景、流程、公式、总结要素也都在,格式也没太大问题。
but,还是经不住细看,比如这个比例的「例」字,和投入的「入」字,拐弯处的笔画收口有点毛边,而且是很明显的:

咱再把难度度再往上提一档,看看AI在面对「超高笔画密度」汉字时的文本渲染稳定性表现如何,以下为提示词:

AI:属实是有点难为我了啊!那就别怪我——大翻车了!(doge

是的,这次确实有点翻车了,龘、麤、叒、齉四个字,没有一个生成对了的,AI直接自己DIY了……
这个故事告诉我们,简单的字儿可以交给AI处理,涉及到如此地狱级复杂字体,大家伙还是老老实实自己在文档里敲字儿吧。

排版设计能力测一测
一个超哇塞的PPT,光有好的内容还不够,它还得——美!观!
要知道我们平时做PPT,挑模板这一步就能让人纠结半天,颜色要高级,排版要有层次,风格还得贴合主题,稍微不搭就显得很违和……
于是乎,我们接下来就重点考察考察千问PPT的审美到不到位,排版稳不稳。
这次咱直接测牛马党高频主题——
业务复盘与增长策略报告,数据多、逻辑重、信息密度高,最考验排版和层级:

从下面的生成效果看,在可视化形式上,折线图、柱状图、环形图、流程图都能准确呈现,图表类型与内容匹配度也比较高,没有出现图不对题的情况。
配色上,延续蓝灰主调,辅以橙色和绿色强调,整体风格统一度不错,尤其前三页色彩控制比较克制。
整体上偏成熟企业汇报风格,还是比较匹配主题的~

整体风格和排版没什么大问题,同理,这是不细看的前提下……因为还是一些小瑕疵的。(哭…
比如第一张趋势页的折线图区域还是略显拥挤,文字甚至已经超出了图表边界,出现了空间规划不足的问题:

以及第四张的流程图,「Q2目标」没居中,战略与经营部和产品与运营部的部门名称写成一行会更合适,现在的断行方式让卡片的重心略微失衡:

另外,大标题的对齐方式没有完全统一,有的居中,有的偏左。
单页看不明显,多页连看时就会造成视觉节奏不一致,也容易让人一瞬间分不清一级标题和二级标题的层级关系:

咋说呢,感觉像精细对齐、留白控制、文本边界这些细节,还是需要人工微调才能真正达到打磨过的水准,排版这种事还是不能完全交给AI…
最后的最后,我本来想尝试一下PPT的局部编辑能力,在表格基础上又加了新的需求,结果发现好像没这能力…

是的,AI不能根据第二次提示词进行局部修改,如果不合适的话,是要重新抽卡生成的……
这波测下来,最大的感受就是:
PPT毕竟是排版+文字+图形的综合活儿,AI在输出这类内容形式时,在字体边缘、图表细节、转角处理这些偏图形的维度上,偶尔还是会有些小瑕疵。
不过回到Qwen的强项——「语义遵循」和「图像生成」这块儿,效果是真能打。
页与页之间逻辑顺序在线,内容承接也比较自然,图片生的更不用说了,非常能体现Qwen模型强大的技术优势…
像日常课堂展示、内部小组汇报、孩子做家庭作业这种场景下使用,还是很推荐的。(最主要的是不花钱…
感兴趣的朋友可以上手试试。
