WordArt Designer是一個基于gpt-3.5 turbo的藝術(shù)字生成框架,包含四個關(guān)鍵模塊:LLM引擎、SemTypo、Styltypo和TextTypo模塊。由gpt-3.5 turbo驅(qū)動的LLM引擎可以解釋用戶輸入,從而將抽象概念轉(zhuǎn)化為具體的設(shè)計(jì)。
SemTypo模塊使用語義概念優(yōu)化字體設(shè)計(jì),在藝術(shù)轉(zhuǎn)換和可讀性之間取得平衡。在SemTypo的基礎(chǔ)上,StyTypo模塊輔助生成精細(xì)的圖像。TextTypo模塊通過紋理渲染進(jìn)一步生成創(chuàng)造性紋理字體。目前應(yīng)用demo已上線至ModelScope創(chuàng)空間,其中對應(yīng)文字變形、紋理渲染相關(guān)等模型也即將在11月開源至ModelScope,敬請期待。
創(chuàng)空間應(yīng)用體驗(yàn)
鏈接:https://modelscope.cn/studios/WordArt/WordArt/summary
阿里云開發(fā)者社區(qū)結(jié)果分享
鏈接:https://developer.aliyun.com/topic/vision/wordart?accounttraceid=1d19d366cfd64c07a8902ff7a5841b85smzy
藝術(shù)字設(shè)計(jì)是語言和設(shè)計(jì)的一個關(guān)鍵交叉點(diǎn),在廣告、幼兒教育和歷史旅游等各個領(lǐng)域都有廣泛的應(yīng)用。遺憾的是,對于非專業(yè)的設(shè)計(jì)師來說,掌握藝術(shù)字設(shè)計(jì)仍然是一個非常挑戰(zhàn)的任務(wù)。盡管之前已經(jīng)有研究工作嘗試彌合業(yè)余設(shè)計(jì)師和專業(yè)藝術(shù)字設(shè)計(jì)之間的差距,但現(xiàn)有的解決方案主要是在預(yù)定義的概念中生成語義連貫和視覺上令人愉悅的藝術(shù)字。這些解決方案通常缺乏適應(yīng)性、創(chuàng)造性和計(jì)算效率。
?
01 技術(shù)架構(gòu)圖
WordArt Designer 系統(tǒng)主要涵蓋4個關(guān)鍵模塊,由大型語言模型(LLM)推動,如通義千問等,促進(jìn)交互式、以用戶為中心的設(shè)計(jì)過程。如圖3所示,用戶定義他們的設(shè)計(jì)需求,包括設(shè)計(jì)概念和領(lǐng)域,例如,“珠寶設(shè)計(jì)中的貓”。
LLM引擎:負(fù)責(zé)解析用戶的設(shè)計(jì)需求,生成提示詞以指導(dǎo)SemTypo、StylTypo和TextTypo模塊,從而執(zhí)行用戶的設(shè)計(jì)愿景;
SemTypo模塊: 負(fù)責(zé)根據(jù)LLM的提示創(chuàng)意詞進(jìn)行文字的變形,其中涉及文字參數(shù)化、區(qū)域筆畫選擇、可微渲染等;
StylTypo模塊: 基于語義變形后的圖像生成更平滑更豐富細(xì)節(jié)的圖片;
TextTypo模塊: 基于LLM的提示創(chuàng)意詞進(jìn)行文字紋理渲染,進(jìn)一步生成帶紋理的創(chuàng)意藝術(shù)字;
為了實(shí)現(xiàn)WordArt的自動化設(shè)計(jì)以及提高最終圖片的質(zhì)量,我們引入了一個質(zhì)量評估反饋機(jī)制,確保進(jìn)入紋理渲染模塊的變形圖片的創(chuàng)意性、藝術(shù)表達(dá)能力以及可擴(kuò)展性。
02 最佳實(shí)踐
目前,WordART Designer對應(yīng)的應(yīng)用已經(jīng)上線至ModelScope創(chuàng)空間:創(chuàng)新藝術(shù)字(https://modelscope.cn/studios/WordArt/WordArt/summary),主要包括以下的三個功能(對應(yīng)創(chuàng)空間的三個tab頁面):
- 文字變形;
- 文字紋理;
- 創(chuàng)意文字生成。
下面對這三個部分逐一進(jìn)行介紹。
01 文字變形
文字變形的功能是基于用戶輸入的創(chuàng)意效果,對用戶輸入的文字進(jìn)行變形,并最終得到變形后的文字圖片。具體的操作步驟如下圖所示:
生成完成后,可以看到如下所示的界面,用戶可以針對生成的結(jié)果進(jìn)行如下的操作:
- 對生成的結(jié)果進(jìn)行切換瀏覽;
- 點(diǎn)擊“為變形字增加紋理”,將對應(yīng)的圖片發(fā)送至【文字紋理】版塊(在下一小節(jié)介紹)進(jìn)行紋理添加;
- 點(diǎn)擊“變形字生成矢量圖”,下載對應(yīng)的矢量圖片。
02 文字紋理
文字紋理的功能是基于用戶輸入的紋理效果,對用戶輸入的文字添加紋理,并最終得到上了紋理的文字圖片。需要注意的事,用戶可以通過以下兩種方式來產(chǎn)生輸入文字圖片:
- 使用【文字變形】版塊生成的變形文字圖片作為輸入,如上一小節(jié)所介紹,通過點(diǎn)擊“為變形字增加紋理”將對應(yīng)的圖片發(fā)送至本版塊;
- 直接輸入文字內(nèi)容,并支持選擇不同的字體。
使用【文字變形】版塊生成的變形文字圖片作為輸入,具體的操作步驟如下:
生成完成后,可以看到如下所示的界面,用戶可以切換查看生成結(jié)果。
如果是直接輸入文字,具體的操作步驟如下:
生成完成后,可以看到如下所示的界面,用戶可以切換查看生成結(jié)果。
03 創(chuàng)意文字生成
有的用戶會覺得上述【文字變形】和【文字紋理】版塊的效果描述過于繁瑣,無法想到很好的描述詞,那不妨試試【創(chuàng)意文字生成】版塊。創(chuàng)意文字生成基于用戶輸入的創(chuàng)意字,利用大語言模型自動為用戶推薦文字變形創(chuàng)意和文字紋理創(chuàng)意,用戶僅需輸入創(chuàng)意字內(nèi)容,就可以得到最終變形和紋理的效果圖。
具體的操作步驟如下:
生成完成后,可以看到如下所示的界面,用戶可以切換查看生成結(jié)果。
探索創(chuàng)作作品
?
?
?
?
?
?
?
本文來源魔搭ModelScope社區(qū),如有侵權(quán)請聯(lián)系刪除
未經(jīng)允許不得轉(zhuǎn)載:RPA中國 | RPA全球生態(tài) | 數(shù)字化勞動力 | RPA新聞 | 推動中國RPA生態(tài)發(fā)展 | 流 > 基于ChatGPT的文本生成藝術(shù)框架—WordArt Designer
熱門信息
閱讀 (14728)
1 2023第三屆中國RPA+AI開發(fā)者大賽圓滿收官&獲獎名單公示閱讀 (13753)
2 《Market Insight:中國RPA市場發(fā)展洞察(2022)》報(bào)告正式發(fā)布 | RPA中國閱讀 (13055)
3 「RPA中國杯 · 第五屆RPA極客挑戰(zhàn)賽」成功舉辦及獲獎名單公示閱讀 (12964)
4 與科技共贏,與產(chǎn)業(yè)共進(jìn),第四屆ISIG中國產(chǎn)業(yè)智能大會成功召開閱讀 (11567)
5 《2022年中國流程挖掘行業(yè)研究報(bào)告》正式發(fā)布 | RPA中國