《探索 AI 绘画的奥秘与魅力》
AI 绘画,作为人工智能领域的一项创新应用,正以其独特的魅力吸引着越来越多的关注。它通过收集大量前人创作的作品,利用算法进行分类和识别,从而生成新的图像。AI 绘画的发展并非一蹴而就,而是经历了漫长的历史进程。
上世纪 50 年代初,美国艺术家拉博斯基用示波器制作的数字作品,开启了 AI 绘画的早期探索。这些作品主要是曲线集合的有序变化,非常抽象。随着技术的不断进步,到上世纪 80 年代,“亚伦”已经可以进行写实创作,但其风格受到程序开发者的影响。近年来,随着深度学习神经网络的发展,AI 绘画程序的创作水准得到了快速提升。2022 年热门的 AI 绘画程序,如 Disco Diffusion、DALL·E2、Midjourney、Stable Diffusion 等,都建立在深度学习神经网络的基础之上。
AI 绘画程序的创作本质上是计算。科学家将程序接入绘画数据库,通过算法对作品进行视觉风格的分析和学习,进行图像模式的识别和计算。如今,AI 绘画已经进入“text-to-image”(文字生成图像)的新阶段。用户只需打开人工智能绘画程序,提供一个词群来描述所想要的内容、风格、材质等,绘画程序就能进行解析,生成相应风格的画作。
在实际应用中,为了获得更符合期望的作品,我们可以采用一些技巧。例如,推荐使用 Prompt 公式,包括画面主体、更多细节描述和更多风格描述。比如,想要生成一个“金毛,在雪中微笑,写实风格”的画作,这样的描述能够让 AI 更好地理解我们的需求。同时,更清晰地表达要生成的内容也是很重要的。比如想要生成一个“明月下的少女”画作,与其直接告诉大模型“明月下的少女”,不如进行更细致的描述:“明亮月光,华服,中国风少女,桂花与仙鹤,脸部精致,古风,二次元”,这样可以绘制出更符合期望的作品。此外,我们还可以通过构造输入+Prompt 修饰词来展示不同修饰词的效果,从而获得更丰富多样的作品。
然而,AI 绘画也存在一些问题。图片生成模型一般由两部分组成,一部分用于文本到图像理解,将文本与图像做关联,另一部分为图像生成。以近年最火的 Stable Diffusion 为例,该模型就包括 CLIP 文本 – 图像的多模态部分、生成图像的 Diffusion 部分。AI 生成图片离谱的问题,一方面可能出在文本 – 图像部分,即训练过程中,模型内将一些本来无关的特征做了不当地、单一化地关联。另一方面,也可能与生成部分有关,由于动漫风格绘图模型的训练集本身有倾向性,可能导致生成过程中出现一些不符合预期的特征,如“男男向腐文化”、“身材性感化肌肉化”、“人像萌化娘化物化”、“物体拟人化”等。即便头部 AI 模型也无法完全解决这些问题。
当下,AI 绘画技术的大幅度进步,激发了人们对“创意 AI”的兴趣。其中,Stable Diffusion 得益于人工智能“扩散”算法,该算法突破了 AI 绘画的应用临界点,更易上手,效果更好。Stable Diffusion 通过潜在的扩散模型,学习图像和文本之间的联系。它的工作原理是,获取图像数据,并对其添加“噪点”,一幅画面被逐步加入噪点,一直到整个画面都变成白噪点。该模型记录这一过程,进行逆转,给 AI 学习。从 AI 的角度,先看到的是一幅布满噪点的画面,再看到画面一点点变清晰,最后成为画作。
Stable Diffusion 和 Dall – E2、Midjourney 类似,都要靠“文字描述”生成图像。不过,Stable Diffusion 是开源的,其基础代码也是公开的,而 Open AI 和 Google 都没有开放自己的人工智能模型。Stability AI 公司的运营和云支出成本较高,但该公司声称可以提供“速度和质量的突破”,内存低于 10G 的 GPU 也能跑,他们还会提供运行在 AMD、苹果 M1/M2 芯片的版本。目前,Stable Diffusion 的功能强大,可以在几秒内将文本转换为 512×512 像素的图像;图像可以转换、放大、修改和替换;使用 GFP – GAN 建模,允许用户上传模糊的面部图像,进行放大或恢复原貌。
除了 Stable Diffusion 等知名的 AI 绘画工具,市场上还有许多其他的 AI 绘画应用。比如改图鸭,它是一款简单易操作的 AI 绘画工具,基础生图功能免费且不限制次数,提供多种类型的模型,用户可以根据自己的需求生成各种类型的图片。LiblibAI 则是一个 AI 绘画模型分享平台,用户可以在线使用或下载各种模型,并参考他人的作品生成类似的图片。
此外,还有一些 AI 绘画工具具有独特的功能。比如,有的工具可以将用户的照片转换成任何想要的风格画作,有的工具提供多种素材分类,激发用户的灵感,还有的工具拥有超多艺术风格供用户选择。这些工具都在不断推动着 AI 绘画的发展,为用户带来更多的创意和可能性。
值得一提的是,图应 AI 是飞链云公司推出的国内首批 AI + IMaas 架构的 AI 商拍优化平台,专注于通过 AI 技术生成指定需求的优质服装商拍图像、服装视频。现阶段完全垂直服务于服装领域。图应 AI 经过大量数据专业训练,具备高智能化能力。也可以无需场景实拍,可以根据服装素材,和数字人进行融合处理,在保留指定特征的基础上嵌入模型表征,自动生成真实模特上身场景或指定需求的商拍内容。图应 AI 具有诸多优势,操作简单,快速出片,模特资源丰富,模特广场和场景广场有数百的模型选择,数字人和场景随意切换,图应 AI 还有 AI 商拍团队,可以为有商拍需求的电商、团队和个人提供全方位的 AI 商拍解决方案。图应的主要特点有:商拍成本下降 50%,效率提升 5 倍以上。无需模特预约,提升新品上线周期。无需外模、布景、化妆、差旅,随意拍摄,AI 自动精修。海量无版权风险的模特可供选择,无出海肖像版权风险担忧。
总的来说,AI 绘画为艺术创作带来了新的机遇和挑战。虽然它在某些方面还存在不足,但随着技术的不断进步,相信 AI 绘画将会在未来的艺术领域中发挥更加重要的作用。
暂无评论内容