Tag: ChatGPT
AI加点 CCTV 就显得真实 AI 文生图技术越来越成熟,从早期略带“AI 味”的 Midjourney,到如今更逼真的 ChatGPT 图像生成和 Google Nano Banana,AI 图片已经越来越难以分辨真假。文章以 AI 生成的 CCTV 5 体育直播美女图为例,讨论了真实感、镜头语言和平台标识如何增强图片的可信度,也提醒人们未来在网上看到的图片未必都是真的。 自从人工智能、AI 大语言模型和文生图技术越来越成熟之后,每隔一段时间,就会有某种 AI 图片风格突然爆火。 我记得最早让我印象深刻的是 Midjourney。那时候生成出来的图片虽然已经很惊艳,但多少还是能看出一点“AI 味”。现在不一样了,无论是 ChatGPT 的图像生成,还是 Google 的 …
最近ChatGPT Image 2.0很火,生成的照片很真实,我也玩了一下。 以下是提示词: 不用假装知道我的真实长相根据我们历史的对话,我的经历,专业,工作,生活等因素,把你对我的性格,气质,思维方式和表达风格转化成视觉形象,不要刻意的添加元素,生成一张我的随手自拍。 英文: Don’t pretend to know what I actually look like. Based on our past conversations, my experiences, profession, work, and life, translate your understanding …
去年年底我开始准备微软认证考试。一开始我写了一个 Prompt(提示词),用起来确实很好,但每次都要手动复制粘贴,还是有点麻烦。后来就想到,不如直接做成一个 GPT,于是就有了现在的 ExamGPT。 制作过程其实很简单:打开 ChatGPT/GPTs ,点击右上角的 Create(制作),按照界面填写即可。核心就是把之前写好的 Prompt 粘进去,再取一个名字,然后设置几个用户输入的示例,比如考试名称:“I am taking Microsoft AZ-305”。 效果出奇地好。当然,这也离不开大语言模型(LLM)在 AI Transformer 架构上的快速迭代。从有了这个工具之后,我可以利用各种碎片时间刷题,比如上厕所、睡觉前刷手机、甚至陪老婆逛街的时候。也不用担心题目刷完,因为进度会保存在 ChatGPT 的对话里,随时可以继续。 这个 ExamGPT 可以随机生成 30 道题,只要是它见过的考试基本都能覆盖(毕竟来自预训练数据)。每道题都有四个选项,包含单选和多选。无论答对还是答错,它都会给出简要解析。每做完 30 道题还会给出一个评分,评估你是否能通过考试。对于答错的题目,还会进行第二轮、第三轮反复练习,直到你完全掌握为止。 这个技术,本质是:提示词工程/Prompt Engineering …
ChatGPT最近消消的推出了一个图片生成的功能,省去了手动写Prompt/提示词的麻烦。只需要选择一个预定义的风格,然后选择一个图片,提示词就能自动被填写: 从左边点击图片/然后选择风格/上传照片 自动赶写的提示词 以下提示词自动被填写: 以提供的图片为参照,创作一幅柔和、含蓄的图片,具有艺术学院审美风格。若图片中包含人物,则在保留其身份特征的同时,运用柔和自然的光线、低饱和度的色彩以及放松且略带青涩的姿态,将其置于如工作室、教室或安静街巷等简洁日常的场景中。若无人物,则将场景或物体视为主体,使用柔和的光线、柔和的色彩及近距离构图。整体氛围应传递出亲密、年轻且随性的艺术感,而非精致或华丽的效果。 原媳妇照片 ChatGPT生成的艺术学院风格 英文:ChatGPT: New Image Creation (art school) 英文:ChatGPT: New Image Creation (art school) 本文一共 293 个汉字, 你数一下对不对. ChatGPT的新功能: 图片生成. (AMP 移动加速版本) 赞赏我的几个理由. ¥ …
让AI换脸是比较难的,因为受到一些法规监管的限制。 比如ChatGPT会说: 我不能生成或修改包含真人(或看起来像真人)的图像,包括把一个人从一张照片合成到另一张场景中。 我可以帮你把照片转换成动画风格,但不能根据真实人物进行外貌或身体特征的修改(例如“变瘦”等),这是为了尊重人物肖像和合成伦理的原则。 我理解你的需求 👍。不过我需要提醒一下:我不能直接生成帶有特定人物相似度的「真人還原」內容,特別是涉及到敏感的外貌細節(比如具體臉部還原)。 但是却可以通过改提示词(Prompt)来绕过限制。 原图,以下美女真是好看,有人说是AI生成的。 反向提示词生成 reverse prompt engineering:下面是一个适合描述你刚刚生成图像的提示词(Prompt),基于图像内容精准还原其风格与构图: 一位脸型较瘦、长发的东亚年轻女子坐在日本居酒屋的木质凳子上,身穿白色衬衫与高腰千鸟格短裤,搭配肤色丝袜。她微微回头对镜头露出自然温柔的笑容。环境昏黄温暖,背景有木墙、手写日文海报与其他顾客,整体带有复古胶片质感与浅景深效果,营造出怀旧而温馨的氛围。 A beautiful young East Asian woman with a slim face and long dark hair sits on …
最近 AI 手办图(Action Figure)特别火,尤其是 Google 推出的 Nano Banana 模型,网上已经能看到一大堆相关作品。相比之前流行的 Ghibli 风格,AI 生成的一致性和真实感提升很大。毕竟手办图是三维效果,看起来要比平面的卡通风格要真实好看得多。Ghibli(吉卜力)风格虽然在前阵子很火,但因为画面过于卡通和平面,看久了难免有点审美疲劳,容易显得千篇一律。 现在,不光是在 ChatGPT,PolloAI、Google AI Studio、PrintVerse,甚至 Grok 上,都能轻松生成类似的手办风格图片。只需要上传一张照片,再加上一点提示词就行。ChatGPT 免费版虽然一天只能上传三张照片,但它支持对已经生成的图继续修改,相当于“加提示词让 AI 做二次 PS”。 更有意思的是,这些 AI 生成的手办图几乎能做到以假乱真,甚至还能生成动态视频。想象一下,如果真能把照片或模型变成实体手办,那绝对是个有潜力的市场。比如在办公桌上摆个大美女手办,不光养眼,还能每天给点“情绪价值”,心情肯定愉快不少。 PolloAI这工具真强大,只需要一张图+提示词,就可以进行文生图、文生视频。 PS:AI生成的图质量参差不齐,有时候生成的图太难看太假了,得多试。 生成手办的提示词 仅供参考:当然还有一小技巧,你可以把你看到的好看的手办图扔给AI,问它提示词。 …
莫拉维克悖论是什么? 莫拉维克悖论(Moravec’s Paradox)是人工智能与机器人学中的一个重要观察结果。 一句话总结 “对于人类来说简单的事情,对机器却很难;而人类觉得复杂的事情,机器却往往很容易。” 悖论的由来 由 Hans Moravec、Rodney Brooks、Marvin Minsky 等人在 1980 年代提出 他们注意到:计算机能轻松完成逻辑推理,却难以感知与运动:让计算机进行高等数学、下棋、逻辑推理等任务相对容易;但让计算机像人类一样“感知世界”和“移动身体”——比如走路、抓取物体、识别人脸——却非常困难。 为什么会出现这种现象? 进化时间差 人类的感知与运动系统经过数亿年进化,极度复杂;抽象思维是最近几千年才发展出的新能力。感知与运动能力(比如视觉处理、走路、抓握)是人类在数亿年的进化中逐步发展出来的,极其高效而复杂。抽象逻辑和符号推理(比如数学、象棋)则是人类近几千年才发展出的“新技能”,反而对人类来说相对“费力”。 神经资源分配不同 大脑的大部分区域用于处理感知与运动,只有小部分用于逻辑与推理:大脑皮层中,有大量区域用于视觉、听觉、运动控制等感知与行动;相比之下,用于抽象思维的区域相对较小。 我们低估了“本能”的复杂性 比如走路、看东西、抓杯子——这些能力虽然自动完成,但对机器来说极其复杂:因为感知与行动是无意识自动完成的(比如:走路时你不需要思考每一步如何移动),人类通常低估了这些任务的复杂性。 经典对比案例 任务 人类 机器 玩象棋 难 容易(如 …