图片 AI 生成绘画是将用户的语言描述,通过软件算法变成画作的过程。描述得越详细,得到的图片越逼真。
比如有一款 APP,生成的作品很惊艳。像描述“最佳品质,无限细节,逼真的照片,最高质量,高分辨率,电影光,丁达尔效应,(美女),苏派旗袍,清晰精致的五官特征,完美五官比例,皮肤白皙,短发,精致的眼睛,红唇,微笑,不漏齿,神情富有神韵,前卫流动的耳饰,散发艺术气质,半身照,江南水乡背景,唯美,浪漫”,就得到了相应的效果图;还有“她秀美的娥眉淡淡的蹙着,在她细致的脸蛋上扫出浅浅的忧虑,让她原本美得出奇的容貌更添了一份我见犹怜的心动”这样的描述,也能生成对应的图片;在赛博朋克城市背景下,“五颜六色的夜晚霓虹灯,女孩,围巾,景深,背景虚拟化,电影照明,焦点,半身像,特写拍摄”的描述也能产出特定的效果图;以及“安德烈亚斯·罗查(Andreas Rocha)风格的一幅老树画,鲜艳的品红色和日落金色,保罗·赫德利(Paul Hedley),法拉利 P30,日落金色”这样的描述也能生成相应的画作。
AI 绘图工具基于大模型技术,模型参数规模越大,越能理解用户需求,生成的画面越准确。目前市面上大部分 AI 作画应用基于英文大模型,部分使用者将中文翻译成英文再生成画作,容易产生表达和理解偏差,影响画作效果。而百度文心 ERNIE-ViLG 是全球最大中文的跨模态生成模型,参数规模达到 100 亿,更懂中文需求,对使用中文的用户更友好。近期文心 ERNIE-ViLG 文图生成算法迎来升级,通过渐进式扩散模型,生成空间由小及大、生成轮廓由粗到细,同时根据生成阶段自动选择最优生成网络,文本生成图像的效果取得进一步提升。
利用 AI 技术生成图片的最终目的是要便捷地为人类创造美的作品,激发人的想象力和创作力。但技术在发展中,做不到十全十美,不能保证每次生成的图片都能尽善尽美,算法生成的图片难免会受到数据的影响,从而导致生成的图片有数据偏见。在分享 AI 生成图片到社交媒体之前,请谨慎评估当前的图片是不是含有令人不适、暴力、色情的内容。
暂无评论内容