
표지를 만드는 법은 설명해 드렸으니, 이미지를 만들어 볼까요?
수정은 포토샵과 프로크리에이트로 하는 편이 효율적이라고 말씀드렸는데요. 그 바탕이 되는 기본 소스는 미드저니로 만드는 경우가 가장 많습니다. 출판에서의 그림은 “그림체의 유지”와 “다양한 그림체”가 필요하기 때문입니다. 책의 내용이나 스타일에 따라 맞는 걸 골라 쓸 수 있으면 좋죠. 이 부분이 AI 작업에서 앞서가는 CF나 게임과는 다릅니다. CF는 실사 사진을 위주로 만들고, 게임은 선호되는 그림체의 범위가 정해져 있어 현재 서비스 중인 이미지 제작 AI를 거의 다 사용할 수 있습니다. 우리가 원하는 건 조금 다른 것들입니다. 그래서 골라서 쓰고 싶고, 그래야 퀄리티가 좋아지니 미드저니를 쓰게 됩니다.

<좌: 미드저니에서 제작한 원본 —profile f6uynmu>
<중간: 챗GPT에서 이미지를 제시하고 토끼로 수정한 이미지>
<우: 미드저니에서 프롬프트에서 곰을 토끼로 변경해 제작한 이미지>
챗GPT는 다른 생성 AI들처럼 이미지의 뎁스맵(깊이값)을 기본으로 형태와 구성을 가져오지만, 결과물에는 챗GPT 스타일이라고 부르는 단순화와 톤 조정이 일어납니다. 이 결과물의 톤과 매너가 맘에 들면 챗GPT를, 원하는 딱 그걸 쓰고 싶다고 생각하면 미드저니를 사용하게 되는 거죠.

<한국만화 스타일, 팝아트 스타일, 플랫 스타일 일러스트레이션, 수채화 스타일 by 챗GPT>
가장 큰 차이는 그림체를 선택하는 법입니다. 미드저니는 우주토끼 예시처럼 —profile f6uynmu 같이 각 그림체에 이름이 붙어있습니다. 이중 프로파일이나 무드보드는 개인이 각자 만든 맞춤형 그림체이고 —sref 는 미드저니 시스템에서 그림체를 불러내는 호출부호입니다. 프로파일은 아티스트, sref는 색연필이냐 물감이냐의 차이라고 보시면 됩니다. 그 외에도 sw, q, iw처럼 세부 조정할 수 있는 파라미터를 사용해서 미세한 차이를 만들어 낼 수 있습니다. 눈으로 보면 외계어 같죠. 세부조정이 필요한 건 일부 작업이고 이런 용어를 몰라도 예쁘게 만들 수 있으니, 그건 걱정하지 않으셔도 됩니다.

<점묘화로 만들어진 사과 한 개, 점묘화라는 명칭을 알아내기 위해 제시한 이미지와 챗GPT의 답변>
챗GPT는 이미지를 제시해서 그림을 그리기 위한 명령어를 물어보고 챗GPT가 제안한 프롬프트로 제작하는 순서로 만듭니다. 예시로 보여드린 네 가지 스타일은 한국인이 선호하는 그림체 순위를 물어보고 에러가 나지 않고 생성되는 명령어를 골라 둔 것입니다. 이론적으로는 미드저니처럼 무한대의 스타일을 만들 수 있겠지만, 세부조정 파라미터가 없어 일부만 사용할 수 있는 거죠. 이미지를 제시하고 비슷하게 만들어달라는 방식도 자주 사용됩니다. 미드저니를 포함한 다른 생성형 이미지 서비스를 이용할 때에도 프롬프트를 만들 때는 챗GPT를 사용할 수 있습니다. 처음 사용하시는 분들은 프롬프트의 문법을 모르니 챗GPT나 퍼블렉시티등에 프롬프트를 물어보는 것도 좋은 방법입니다. 고수들도 종종 사용한답니다.

원하는 걸 제대로 만들려면 챗GPT에서도 프롬프팅이 중요합니다. 처음에 그림을 분석시켜서 이름을 알았으니까 점묘화 스타일로 명령합니다. 그림의 어떤 부분을 바꿔 그릴 건지도 말해주면 더 잘 그려줍니다. 참고 이미지와 명령어가 매칭이 잘 되면 결과도 더 좋아집니다. <중요한 건 일관성입니다.> 점묘화인데 섬세한 펜선을 넣어달라거나 하면 명령어가 부딪혀 에러가 납니다. 원하는 이미지가 나오지 않았다면 일관성있게 명령했는지 확인해 보아야 합니다.
미드저니 자유도의 핵심, 고수의 무드보드

미드저니가 한끝 다른 건 세부조정과 무한한 표현력이죠. 미드저니의 목표는 개개인이 원하는 아름다움을 표현하는 것, 무드보드는 이걸 가능하게 하는 도구입니다. 원하는 이미지를 선택하면 그 이미지로 그림체를 만들어 코드를 부여해 주고 해당 코드로 이미지를 만들면 계속 성장해나갑니다. 내가 만든 이미지를 넣어도 좋고, 다른 곳에서 만든 이미지를 넣어서 만들 수도 있습니다. 사진 보시면 7장부터 59장까지 입력된 사진의 수도 다릅니다. 뒤에서 자세히 설명해 드리겠지만, 무엇을 넣느냐에 따라 달라집니다. 너무 다양한 걸 넣으면 그림체가 유지되지 않습니다. 색연필이면 색연필, 수채면 수채 종류는 일정하게 넣어주어야 합니다. 고양이는 저의 4번 무드보드로 만든 이미지입니다. 무드보드에는 색상, 재료, 방식, 화면구성 등이 포함되는데 이걸 코딩 없이 이미지로 구현합니다. 쉽고 간단하죠. 원하는 무드보드를 골라, 키워드를 넣기만 하면 됩니다.
미드저니보다 일 잘하는 AI가 있다?
안타깝게도 내가 원하는 모든 것을 한 AI에서 만들 수는 없습니다. 서비스 회사들이 각자 추구하는 목표가 다르기 때문인데요. 현실에 가까운 자료사진을 만들고 싶다면 구글의 ImageFX가 더 유리합니다. 구글의 검색정보를 바탕으로 학습된 사진들은 데이터 누적에서는 따라올 회사가 없죠. 게다가 무료고요.

<구글의 생성화면. 시드의 잠금쇠 버튼을 눌러 잠그면 같은 분위기로 생성됩니다>

<한글 입력 가능, 실사라면 빛이 반사되는 표면까지 완벽에 가깝게 만들어 냅니다>

<무엇보다 한복을 잘 만듭니다. 현실에 있는 물건을 만들어야 한다면 구글을 추천>
만약 실용서를 만든다면, 텍스트를 시각화 해주고 도표로 만들어주는 AI가 필요합니다. 미드저니에서 하는 건 어렵습니다. 여기에 특화된 한글이 가능한 AI는 따로 있습니다. 냅킨 https://www.napkin.ai/ 입니다.

<텍스트를 입력하고 해당 부분의 파랑 버튼을 클릭하면 스타일을 제안합니다. 스타일을 고르면 도표로 만들어줍니다.>

<포인트 아이콘도 제작해줍니다. 굵기, 색상 스타일을 세부조정할 수 있습니다>
포트폴리오 홈페이지를 자동으로 만들어주는 윅스 https://ko.wix.com/ 3D를 만들어 주는 트리포드 https://www.tripo3d.ai/ 홍보 영상을 만들 때 음성을 만들어주는 일레븐 랩스 https://elevenlabs.io/ 등 용도에 특화된 AI는 계속 출시되는 중입니다. 한국어와 영상의 자동 립싱크는 아직 2% 부족하니 조금 더 기다려야 할 것 같고요.
필요한 부분만 딱 골라서 미드저니를 배워 봅시다.
AI가 잘하는 것과 못하는 것, 이 차이를 아는 것도 저를 포함한 AI에 익숙한 작업자들의 노하우 중 하나입니다. 먼저 안되는 것부터 알아두고 시작합시다. 소설의 표지 일러스트를 기준으로 했을 때, 이미지 생성이 차지하는 기여도는 40%이하 입니다. 수정작업이 전체 작업의 절반 이상을 차지하는 거죠. 관련 커뮤니티에서 아트웍을 올려주시는 고수분들의 이미지도 대부분 포토샵으로 수정과정을 거칩니다. (수작업이 포함되어 있어 가져다 쓰면 안 된다는 뜻입니다) 프롬프팅으로 제어가 안 되는 부분들도 문제지만 가장 큰 부분은 노이즈입니다. 지정하지 않은 찌꺼기가 같이 생성되거나 생성하다 말아버리는 요소들은 지워야 하고, 여러분이 널리 아시는 대로 손가락을 포함한 오류들은 내부 에디터를 사용해도 완벽하지 않고, 반복해서 명령해야 수정할 수 있어서 요금을 낭비하게 됩니다. 그래서 <사물의 세부묘사가 다량 등장하는 그림>의 경우 합성, 리터치 없이 작품을 완성할 수 없습니다. 예를 들면 아래 그림을 기준으로 무릎에 있는 노이즈, 여자아이의 손, 곰돌이의 다리 사이 노이즈, 다리 길이 등이 수정되어야 쓸 수 있습니다. 저는 이 정도 이미지는 포토샵을 이용해 수정합니다.

숫자와 문자도 문제입니다. <개수를 정확하게 세어 구현하지 못하는> 경우가 많고, 글자도 오류가 많습니다. 챗GPT 카툰 만들기가 유행해서 많이들 보셨을 텐데, 오타가 참 많죠. 이디오그램Ideogram같이 로고를 전문으로 만드는 AI가 아니면 한글만 그런 게 아니라 영어도 대충 쓰고 중국어도 대충 씁니다. 한 화면에 서로 다른 캐릭터가 다른 포즈를 취하는 명령어는 구현되지 않는 경우가 많습니다. 옷이 서로 달라도 얼굴이 너무 똑같거나 하면 어색해서 쓸 수가 없죠. 그래서 여러 캐릭터가 필요한 경우에도 합성과 리터치가 필수입니다.

<좌 : 사과 10개를 생성하라고 했더니, 중: 티파티의 소녀들을 만들었더니 얼굴이 복사판, 우: kalimakeanother를 만들라고 했더니 길어서 대충 쓴)
예를 들어 교복의 리본이나 학교의 로고, 같이 작고 정확해야 하는 것들은 그려둔 것을 붙여넣는 편이 빠르죠. 회사 로고 같은 것은 <따라 그리지 못하는> AI의 특성상, 영상을 제작하는 분들도 포토샵에서 사진을 수정합니다. 그럼 AI는 어디에 쓰냐. 수작업을 못 하고 이미지를 AI에 의존해서 그린다면 <단순하고, 요소가 많지 않은 일관성 있는 그림>이 유리합니다. 풍경화, 정물화, 인물이라면 허리 위를 그리는 웨이스트 컷 같은 것들이죠. 생각보다 많이 쓰이는 이미지들입니다.
마지막으로 생성형AI그림은 해상도 문제가 있습니다. 웹서비스들은 고화질의 이미지를 제공하지 않거나, 고화질로 만들려면 시간이 걸리거나, 또는 아주 값비싼 비용을 지불 해야 합니다. 우리가 책을 만들려면 300dpi가 필요하죠. 그래서 우리는 업스케일러를 사용해야 합니다. 다양한 종류가 있지만 제가 사용하는 건 컴퓨터에 설치해서 쓰는 upscayl 이라는 프로그램입니다. 한 장씩은 무료로 사용할 수 있고 한 번에 여러 이미지를 작업하려면 유료모델을 사용합니다. 이미지를 끌어다 놓고, 버튼을 누르면 끝! 간단하죠?

<업스케일 사용화면 다운로드는 https://upscayl.org/download>
이제 AI에 대해 다 배우셨으니 이미지를 생성해 볼 차례입니다. 우리는 인쇄물에 사용할 수 있는 이미지를 만들 예정이니 <한 번에 딸깍은 안 된다.>와 <매의 눈으로 오류를 걸러 낸다.>를 기억하면서 시작해 보시죠.

미드저니의 첫 화면입니다. 우리는 여기서부터 시작할 겁니다. 가장 먼저 보이는 화면은 공개된 프롬프트와 이미지를 사용하고 편집해 볼 수 있는 Explore입니다. 여기서 이미지를 선택하거나 (1) 상단 우측 끝의 Search에 원하는 단어를 넣으면 해당하는 작품을 찾을 수 있습니다(2). 저는 첫 화면에서 제 취향의 이미지를 찾았습니다. 프롬프트를 응용해서 새로운 작품으로 만들어 봅시다.

이미지를 클릭하면 나오는 화면입니다. 고른 이미지라면 우측하단에 3개의 메뉴가 나오는데요. 프롬프트 prompt 버튼을 누르면 상단의 입력창에 프롬프트가 자동으로 입력됩니다. 입력창의 종이비행기를 누르거나, 엔터키를 치면 제작이 시작됩니다.

Create 메뉴에 들어오면 같은 톤과 매너, 구성이 같은 이미지가 생성되었습니다. 이 그림체로 원하는 그림을 만들어 보겠습니다. 저는 바닷가로 만들어 보겠습니다. 이 프롬프트에서 그림체를 표현하는 부분은 (which accounts for 30% of the picture,sketchy strokes,negative space 40%,vintage notebook texture, Flat illustration, cute cartoon design, city street background, modern style --no shading --no rendering --ar 9:16 --raw --sref 1831983442 --profile c6so3sz --sv 4 —stylize 500)입니다. 이 부분만 남기고 바닷가Seaside를 넣어보겠습니다.

바닷가라고 볼 수는 있는데 원하는 것이 아니니, 하늘과 파도 with sky and sea wave를 추가해 풍경화로 바꾸어 보겠습니다.

sref 나 profile은 색이나 스타일이 지정된 지정부호입니다. 나오는 그림으로 보아 네거티브 프롬프트인--no shading, --no rendering이 필요 없어 보이니 이것도 지워보겠습니다.

이제 제가 원하는, 바닷가에 하늘과 파도가 보이는 프롬프트가 완성되었습니다. 여기에 갈매기를 추가하거나, 하늘에 구름을 추가할 수 있겠네요. Rerun을 누르면 이 프롬프트 그대로 다시 생성해 줍니다. 다른 그림을 만들어도 되지만, 이번에는 일부를 수정해보죠.

내가 생성한 그림을 누르면 화면 하단에 여러 가지 메뉴가 나옵니다. Vary에서 Subtile, Strong는 조금씩 바꿔서 만들어 보라는 명령이고 Upscale은 고해상도로 만들어주면서 조금씩 바꿔줍니다. Rerun은 재생성, 우리는 Edit 메뉴를 사용해 볼 겁니다. 에디트 메뉴에서는 화면의 비율을 바꿀 수 있고 원하는 부분을 새로 그리라고 명령할 수 있습니다. 원하는 부분을 브러시로 칠하고 <프롬프트의 제일 앞>에 무엇을 그릴지 써주면 됩니다. 잘못했거나 되돌릴 때는 메뉴 상단의 좌우 화살표를 누릅니다. 동그라미는 원본으로 돌리는 버튼입니다.

화면을 4:3으로 바꾸고 거슬리는 부분을 스마트 셀렉트 Smart Select – Erase Selection버튼을 눌러 지워보면 적당히 지워내고 우측을 채워 그려줍니다.

이렇게, 찾아낸 예시 이미지의 프롬프트를 편집하고 그림을 수정해 제가 원하는 이미지에 도달했습니다. 여기서 다시 수정작업을 반복할 수도 있습니다. 만족스러운 이미지가 나올 때까지 계속할 수 있습니다.

이번에는 메인 화면의 우측 Search에서 키워드로 이미지를 찾아봅시다. 요즘 AI 영상으로 많이 만드는 미니어처를 찾아서 만들어 봅시다.
메인 화면의 상단 우측 검색창에 Miniature를 입력하니 미니어처 스타일의 사진들이 나왔습니다. 저는 손가락 위에 올라갈 정도로 작은 고양이에 도전!

프롬프트 버튼을 누르고, 바꿔야 하는 부분은 <a tiny kitten>과 <kitten appears> 두 곳입니다. 프롬프트를 고칠 때 이렇게 여러 번 강조해서 쓰인 부분을 모두 바꾸어야 원하는 이미지가 나옵니다. 나머지 부분은 스타일을 좌우하는 부분이니 건드리면 스타일이 바뀝니다.

하얀 고양이로 바뀌었습니다. Chaos는 이미지에 여러 복잡성을 더해주고 Stylize는 시스템이 알아서 세심하게 그리라고 요청하는 파라미터입니다. 우측 고양이는 스타일을 1000으로 올려 만든 이미지인데요. 배경에 니트가 추가되었네요. 다른 파라미터도 있지만 화면의 비율을 정하는 <--ar>, 과 필요 없는 것을 제외하라고 요청하는 <--no>만 기억하시면 나머지는 모르셔도 이미지를 만들 수 있습니다.
프롬프트를 찾아서 만들어 보았습니다. 더 복잡한 내가 원하는 이미지를 만들고 싶다면 챗GPT나 퍼블렉시티를 이용할 수 있습니다. 원하는 이미지를 주고 분석해서 프롬프트를 만들어 달라고 하면 우리가 편집할 수 있는 기본 프롬프트를 제공해 줍니다. 이미지 분석은 미드저니에서도 가능합니다.

챗GPT에서 1차로 만들어 봅니다. 너무 단순해서 화분과 꽃을 추가해 달라고 해서 2차로 만들어낸 이미지를 미드저니의 입력창 what will you imagine? 에 가까이 가져가면 숨겨져 있든 describe화면이 나옵니다.

여기에 그림을 넣으면 아래처럼 그림을 분석해서 프롬프트를 제공해 줍니다. image Prompts에 넣으면 이미지를 참조해 그리고, Style References에 넣으면 스타일을 가져옵니다. 캐릭터나 사물을 따라 그리게 하고 싶을 때는 신기능! Omni-Reference 에 넣으면 됩니다.

앞에서도 말씀드렸지만, 그림을 분석한다고 해서 같은 그림이 나오는 건 아닙니다. 메타정보라고 부르는 그림을 설명하는 키워드만 사용하기 때문입니다. 프롬프트를 비교해 보시면 무엇을 우선하느냐에 따라 그림도 조금씩 달라집니다. 잘 섞으면 예쁜걸 만들 수 있겠죠? 간판에 글씨는 쓸 수 없으니 에디터에서 브러시로 선택하고 “clear”나 “blank”를 넣어서 지워주면 됩니다. 글씨는 포토샵이나 캔바에 맡기기로 하죠.

그림을 그릴 때는 니지를 써도 됩니다. 미드저니 요금을 내면 둘 다 사용할 수 있고 사용법은 거의 동일 합니다. https://nijijourney.com/imagine 으로 접속합니다. 미드저니 화면에서 프롬프트의 마지막 부분인 <--v 7>을 <--niji 6>로 넣으면 니지 서버를 호출해 그림을 제작합니다. 미드저니 서버에서 니지를 호출해 사용하셔도 되고, 니지로 접속해 사용해도 무방합니다. 차이는 니지는 한글을 쓸 수 있다는 점인데요. 최근에는 v7에서도 한글을 사용할 수 있습니다.

니지와 미드저니는 그리는 방식이 달라서 색과 스타일을 정하는 <--sref>등의 파라미터를 똑같이 써도 결과가 다르게 나타납니다. 서버를 오가며 원하는 스타일을 찾아보시면 좋겠죠?
여러 가지 방법으로 이미지를 만들어 보시니 어떠신가요? 그다지 어렵지 않습니다. AI 업체들은 서비스를 점점 더 쉽게 개선하고 있거든요. 화면 상단에 번개아이콘은 미드저니에서 챗GPT처럼 대화하며 이미지를 만들어나가는 서비스입니다. 말칸 아이콘은 음성인식으로 제작할 수 있는 서비스입니다. 최근 업데이트된 미드저니의 --oref 기능은 인물, 사진 속 제품의 구현율이 좋아진 상태입니다. 내년쯤 되면 사진의 영역에서라면 포토샵이 거의 필요 없어질지도 모르겠습니다.
그대로 사용하는 고수의 코드 자료,
프롬프트에 익숙해졌다면 내용을 보면서 어? 저 sref라는 건 어떻게 찾지? --profile 이라는 건 어떻게? 라고 생각하실 타이밍입니다. 가장 많은 코드를 수집할 수 있는 곳은 “미드저니 코리아 페이스북 그룹”의 조남경 그룹장님 게시글입니다. 매일 새 코드를 공개해 주고 계신데요. 이미 그룹에 공개한 코드만 천여 개가 넘으니 살펴보시면 좋겠죠? 책에 응용해서 사용하면 좋은 코드들을 소개해드립니다. 본문에 있는 프롬프트들도 따라서 써보시고 또 찾아서 써보시는 즐거움을 누리시면서 원하는 아름다운 그림을 만드실 수 있길 기원합니다.
(첨부 파일을 확인해주세요)
표지를 만드는 법은 설명해 드렸으니, 이미지를 만들어 볼까요?
수정은 포토샵과 프로크리에이트로 하는 편이 효율적이라고 말씀드렸는데요. 그 바탕이 되는 기본 소스는 미드저니로 만드는 경우가 가장 많습니다. 출판에서의 그림은 “그림체의 유지”와 “다양한 그림체”가 필요하기 때문입니다. 책의 내용이나 스타일에 따라 맞는 걸 골라 쓸 수 있으면 좋죠. 이 부분이 AI 작업에서 앞서가는 CF나 게임과는 다릅니다. CF는 실사 사진을 위주로 만들고, 게임은 선호되는 그림체의 범위가 정해져 있어 현재 서비스 중인 이미지 제작 AI를 거의 다 사용할 수 있습니다. 우리가 원하는 건 조금 다른 것들입니다. 그래서 골라서 쓰고 싶고, 그래야 퀄리티가 좋아지니 미드저니를 쓰게 됩니다.
<좌: 미드저니에서 제작한 원본 —profile f6uynmu>
<중간: 챗GPT에서 이미지를 제시하고 토끼로 수정한 이미지>
<우: 미드저니에서 프롬프트에서 곰을 토끼로 변경해 제작한 이미지>
챗GPT는 다른 생성 AI들처럼 이미지의 뎁스맵(깊이값)을 기본으로 형태와 구성을 가져오지만, 결과물에는 챗GPT 스타일이라고 부르는 단순화와 톤 조정이 일어납니다. 이 결과물의 톤과 매너가 맘에 들면 챗GPT를, 원하는 딱 그걸 쓰고 싶다고 생각하면 미드저니를 사용하게 되는 거죠.
<한국만화 스타일, 팝아트 스타일, 플랫 스타일 일러스트레이션, 수채화 스타일 by 챗GPT>
가장 큰 차이는 그림체를 선택하는 법입니다. 미드저니는 우주토끼 예시처럼 —profile f6uynmu 같이 각 그림체에 이름이 붙어있습니다. 이중 프로파일이나 무드보드는 개인이 각자 만든 맞춤형 그림체이고 —sref 는 미드저니 시스템에서 그림체를 불러내는 호출부호입니다. 프로파일은 아티스트, sref는 색연필이냐 물감이냐의 차이라고 보시면 됩니다. 그 외에도 sw, q, iw처럼 세부 조정할 수 있는 파라미터를 사용해서 미세한 차이를 만들어 낼 수 있습니다. 눈으로 보면 외계어 같죠. 세부조정이 필요한 건 일부 작업이고 이런 용어를 몰라도 예쁘게 만들 수 있으니, 그건 걱정하지 않으셔도 됩니다.
<점묘화로 만들어진 사과 한 개, 점묘화라는 명칭을 알아내기 위해 제시한 이미지와 챗GPT의 답변>
챗GPT는 이미지를 제시해서 그림을 그리기 위한 명령어를 물어보고 챗GPT가 제안한 프롬프트로 제작하는 순서로 만듭니다. 예시로 보여드린 네 가지 스타일은 한국인이 선호하는 그림체 순위를 물어보고 에러가 나지 않고 생성되는 명령어를 골라 둔 것입니다. 이론적으로는 미드저니처럼 무한대의 스타일을 만들 수 있겠지만, 세부조정 파라미터가 없어 일부만 사용할 수 있는 거죠. 이미지를 제시하고 비슷하게 만들어달라는 방식도 자주 사용됩니다. 미드저니를 포함한 다른 생성형 이미지 서비스를 이용할 때에도 프롬프트를 만들 때는 챗GPT를 사용할 수 있습니다. 처음 사용하시는 분들은 프롬프트의 문법을 모르니 챗GPT나 퍼블렉시티등에 프롬프트를 물어보는 것도 좋은 방법입니다. 고수들도 종종 사용한답니다.
원하는 걸 제대로 만들려면 챗GPT에서도 프롬프팅이 중요합니다. 처음에 그림을 분석시켜서 이름을 알았으니까 점묘화 스타일로 명령합니다. 그림의 어떤 부분을 바꿔 그릴 건지도 말해주면 더 잘 그려줍니다. 참고 이미지와 명령어가 매칭이 잘 되면 결과도 더 좋아집니다. <중요한 건 일관성입니다.> 점묘화인데 섬세한 펜선을 넣어달라거나 하면 명령어가 부딪혀 에러가 납니다. 원하는 이미지가 나오지 않았다면 일관성있게 명령했는지 확인해 보아야 합니다.
미드저니 자유도의 핵심, 고수의 무드보드
미드저니가 한끝 다른 건 세부조정과 무한한 표현력이죠. 미드저니의 목표는 개개인이 원하는 아름다움을 표현하는 것, 무드보드는 이걸 가능하게 하는 도구입니다. 원하는 이미지를 선택하면 그 이미지로 그림체를 만들어 코드를 부여해 주고 해당 코드로 이미지를 만들면 계속 성장해나갑니다. 내가 만든 이미지를 넣어도 좋고, 다른 곳에서 만든 이미지를 넣어서 만들 수도 있습니다. 사진 보시면 7장부터 59장까지 입력된 사진의 수도 다릅니다. 뒤에서 자세히 설명해 드리겠지만, 무엇을 넣느냐에 따라 달라집니다. 너무 다양한 걸 넣으면 그림체가 유지되지 않습니다. 색연필이면 색연필, 수채면 수채 종류는 일정하게 넣어주어야 합니다. 고양이는 저의 4번 무드보드로 만든 이미지입니다. 무드보드에는 색상, 재료, 방식, 화면구성 등이 포함되는데 이걸 코딩 없이 이미지로 구현합니다. 쉽고 간단하죠. 원하는 무드보드를 골라, 키워드를 넣기만 하면 됩니다.
미드저니보다 일 잘하는 AI가 있다?
안타깝게도 내가 원하는 모든 것을 한 AI에서 만들 수는 없습니다. 서비스 회사들이 각자 추구하는 목표가 다르기 때문인데요. 현실에 가까운 자료사진을 만들고 싶다면 구글의 ImageFX가 더 유리합니다. 구글의 검색정보를 바탕으로 학습된 사진들은 데이터 누적에서는 따라올 회사가 없죠. 게다가 무료고요.
<구글의 생성화면. 시드의 잠금쇠 버튼을 눌러 잠그면 같은 분위기로 생성됩니다>
<한글 입력 가능, 실사라면 빛이 반사되는 표면까지 완벽에 가깝게 만들어 냅니다>
<무엇보다 한복을 잘 만듭니다. 현실에 있는 물건을 만들어야 한다면 구글을 추천>
만약 실용서를 만든다면, 텍스트를 시각화 해주고 도표로 만들어주는 AI가 필요합니다. 미드저니에서 하는 건 어렵습니다. 여기에 특화된 한글이 가능한 AI는 따로 있습니다. 냅킨 https://www.napkin.ai/ 입니다.
<텍스트를 입력하고 해당 부분의 파랑 버튼을 클릭하면 스타일을 제안합니다. 스타일을 고르면 도표로 만들어줍니다.>
<포인트 아이콘도 제작해줍니다. 굵기, 색상 스타일을 세부조정할 수 있습니다>
포트폴리오 홈페이지를 자동으로 만들어주는 윅스 https://ko.wix.com/ 3D를 만들어 주는 트리포드 https://www.tripo3d.ai/ 홍보 영상을 만들 때 음성을 만들어주는 일레븐 랩스 https://elevenlabs.io/ 등 용도에 특화된 AI는 계속 출시되는 중입니다. 한국어와 영상의 자동 립싱크는 아직 2% 부족하니 조금 더 기다려야 할 것 같고요.
필요한 부분만 딱 골라서 미드저니를 배워 봅시다.
AI가 잘하는 것과 못하는 것, 이 차이를 아는 것도 저를 포함한 AI에 익숙한 작업자들의 노하우 중 하나입니다. 먼저 안되는 것부터 알아두고 시작합시다. 소설의 표지 일러스트를 기준으로 했을 때, 이미지 생성이 차지하는 기여도는 40%이하 입니다. 수정작업이 전체 작업의 절반 이상을 차지하는 거죠. 관련 커뮤니티에서 아트웍을 올려주시는 고수분들의 이미지도 대부분 포토샵으로 수정과정을 거칩니다. (수작업이 포함되어 있어 가져다 쓰면 안 된다는 뜻입니다) 프롬프팅으로 제어가 안 되는 부분들도 문제지만 가장 큰 부분은 노이즈입니다. 지정하지 않은 찌꺼기가 같이 생성되거나 생성하다 말아버리는 요소들은 지워야 하고, 여러분이 널리 아시는 대로 손가락을 포함한 오류들은 내부 에디터를 사용해도 완벽하지 않고, 반복해서 명령해야 수정할 수 있어서 요금을 낭비하게 됩니다. 그래서 <사물의 세부묘사가 다량 등장하는 그림>의 경우 합성, 리터치 없이 작품을 완성할 수 없습니다. 예를 들면 아래 그림을 기준으로 무릎에 있는 노이즈, 여자아이의 손, 곰돌이의 다리 사이 노이즈, 다리 길이 등이 수정되어야 쓸 수 있습니다. 저는 이 정도 이미지는 포토샵을 이용해 수정합니다.
숫자와 문자도 문제입니다. <개수를 정확하게 세어 구현하지 못하는> 경우가 많고, 글자도 오류가 많습니다. 챗GPT 카툰 만들기가 유행해서 많이들 보셨을 텐데, 오타가 참 많죠. 이디오그램Ideogram같이 로고를 전문으로 만드는 AI가 아니면 한글만 그런 게 아니라 영어도 대충 쓰고 중국어도 대충 씁니다. 한 화면에 서로 다른 캐릭터가 다른 포즈를 취하는 명령어는 구현되지 않는 경우가 많습니다. 옷이 서로 달라도 얼굴이 너무 똑같거나 하면 어색해서 쓸 수가 없죠. 그래서 여러 캐릭터가 필요한 경우에도 합성과 리터치가 필수입니다.
<좌 : 사과 10개를 생성하라고 했더니, 중: 티파티의 소녀들을 만들었더니 얼굴이 복사판, 우: kalimakeanother를 만들라고 했더니 길어서 대충 쓴)
예를 들어 교복의 리본이나 학교의 로고, 같이 작고 정확해야 하는 것들은 그려둔 것을 붙여넣는 편이 빠르죠. 회사 로고 같은 것은 <따라 그리지 못하는> AI의 특성상, 영상을 제작하는 분들도 포토샵에서 사진을 수정합니다. 그럼 AI는 어디에 쓰냐. 수작업을 못 하고 이미지를 AI에 의존해서 그린다면 <단순하고, 요소가 많지 않은 일관성 있는 그림>이 유리합니다. 풍경화, 정물화, 인물이라면 허리 위를 그리는 웨이스트 컷 같은 것들이죠. 생각보다 많이 쓰이는 이미지들입니다.
마지막으로 생성형AI그림은 해상도 문제가 있습니다. 웹서비스들은 고화질의 이미지를 제공하지 않거나, 고화질로 만들려면 시간이 걸리거나, 또는 아주 값비싼 비용을 지불 해야 합니다. 우리가 책을 만들려면 300dpi가 필요하죠. 그래서 우리는 업스케일러를 사용해야 합니다. 다양한 종류가 있지만 제가 사용하는 건 컴퓨터에 설치해서 쓰는 upscayl 이라는 프로그램입니다. 한 장씩은 무료로 사용할 수 있고 한 번에 여러 이미지를 작업하려면 유료모델을 사용합니다. 이미지를 끌어다 놓고, 버튼을 누르면 끝! 간단하죠?
<업스케일 사용화면 다운로드는 https://upscayl.org/download>
이제 AI에 대해 다 배우셨으니 이미지를 생성해 볼 차례입니다. 우리는 인쇄물에 사용할 수 있는 이미지를 만들 예정이니 <한 번에 딸깍은 안 된다.>와 <매의 눈으로 오류를 걸러 낸다.>를 기억하면서 시작해 보시죠.
미드저니의 첫 화면입니다. 우리는 여기서부터 시작할 겁니다. 가장 먼저 보이는 화면은 공개된 프롬프트와 이미지를 사용하고 편집해 볼 수 있는 Explore입니다. 여기서 이미지를 선택하거나 (1) 상단 우측 끝의 Search에 원하는 단어를 넣으면 해당하는 작품을 찾을 수 있습니다(2). 저는 첫 화면에서 제 취향의 이미지를 찾았습니다. 프롬프트를 응용해서 새로운 작품으로 만들어 봅시다.
이미지를 클릭하면 나오는 화면입니다. 고른 이미지라면 우측하단에 3개의 메뉴가 나오는데요. 프롬프트 prompt 버튼을 누르면 상단의 입력창에 프롬프트가 자동으로 입력됩니다. 입력창의 종이비행기를 누르거나, 엔터키를 치면 제작이 시작됩니다.
Create 메뉴에 들어오면 같은 톤과 매너, 구성이 같은 이미지가 생성되었습니다. 이 그림체로 원하는 그림을 만들어 보겠습니다. 저는 바닷가로 만들어 보겠습니다. 이 프롬프트에서 그림체를 표현하는 부분은 (which accounts for 30% of the picture,sketchy strokes,negative space 40%,vintage notebook texture, Flat illustration, cute cartoon design, city street background, modern style --no shading --no rendering --ar 9:16 --raw --sref 1831983442 --profile c6so3sz --sv 4 —stylize 500)입니다. 이 부분만 남기고 바닷가Seaside를 넣어보겠습니다.
바닷가라고 볼 수는 있는데 원하는 것이 아니니, 하늘과 파도 with sky and sea wave를 추가해 풍경화로 바꾸어 보겠습니다.
sref 나 profile은 색이나 스타일이 지정된 지정부호입니다. 나오는 그림으로 보아 네거티브 프롬프트인--no shading, --no rendering이 필요 없어 보이니 이것도 지워보겠습니다.
이제 제가 원하는, 바닷가에 하늘과 파도가 보이는 프롬프트가 완성되었습니다. 여기에 갈매기를 추가하거나, 하늘에 구름을 추가할 수 있겠네요. Rerun을 누르면 이 프롬프트 그대로 다시 생성해 줍니다. 다른 그림을 만들어도 되지만, 이번에는 일부를 수정해보죠.
내가 생성한 그림을 누르면 화면 하단에 여러 가지 메뉴가 나옵니다. Vary에서 Subtile, Strong는 조금씩 바꿔서 만들어 보라는 명령이고 Upscale은 고해상도로 만들어주면서 조금씩 바꿔줍니다. Rerun은 재생성, 우리는 Edit 메뉴를 사용해 볼 겁니다. 에디트 메뉴에서는 화면의 비율을 바꿀 수 있고 원하는 부분을 새로 그리라고 명령할 수 있습니다. 원하는 부분을 브러시로 칠하고 <프롬프트의 제일 앞>에 무엇을 그릴지 써주면 됩니다. 잘못했거나 되돌릴 때는 메뉴 상단의 좌우 화살표를 누릅니다. 동그라미는 원본으로 돌리는 버튼입니다.
화면을 4:3으로 바꾸고 거슬리는 부분을 스마트 셀렉트 Smart Select – Erase Selection버튼을 눌러 지워보면 적당히 지워내고 우측을 채워 그려줍니다.
이렇게, 찾아낸 예시 이미지의 프롬프트를 편집하고 그림을 수정해 제가 원하는 이미지에 도달했습니다. 여기서 다시 수정작업을 반복할 수도 있습니다. 만족스러운 이미지가 나올 때까지 계속할 수 있습니다.
이번에는 메인 화면의 우측 Search에서 키워드로 이미지를 찾아봅시다. 요즘 AI 영상으로 많이 만드는 미니어처를 찾아서 만들어 봅시다.
메인 화면의 상단 우측 검색창에 Miniature를 입력하니 미니어처 스타일의 사진들이 나왔습니다. 저는 손가락 위에 올라갈 정도로 작은 고양이에 도전!
프롬프트 버튼을 누르고, 바꿔야 하는 부분은 <a tiny kitten>과 <kitten appears> 두 곳입니다. 프롬프트를 고칠 때 이렇게 여러 번 강조해서 쓰인 부분을 모두 바꾸어야 원하는 이미지가 나옵니다. 나머지 부분은 스타일을 좌우하는 부분이니 건드리면 스타일이 바뀝니다.
하얀 고양이로 바뀌었습니다. Chaos는 이미지에 여러 복잡성을 더해주고 Stylize는 시스템이 알아서 세심하게 그리라고 요청하는 파라미터입니다. 우측 고양이는 스타일을 1000으로 올려 만든 이미지인데요. 배경에 니트가 추가되었네요. 다른 파라미터도 있지만 화면의 비율을 정하는 <--ar>, 과 필요 없는 것을 제외하라고 요청하는 <--no>만 기억하시면 나머지는 모르셔도 이미지를 만들 수 있습니다.
프롬프트를 찾아서 만들어 보았습니다. 더 복잡한 내가 원하는 이미지를 만들고 싶다면 챗GPT나 퍼블렉시티를 이용할 수 있습니다. 원하는 이미지를 주고 분석해서 프롬프트를 만들어 달라고 하면 우리가 편집할 수 있는 기본 프롬프트를 제공해 줍니다. 이미지 분석은 미드저니에서도 가능합니다.
챗GPT에서 1차로 만들어 봅니다. 너무 단순해서 화분과 꽃을 추가해 달라고 해서 2차로 만들어낸 이미지를 미드저니의 입력창 what will you imagine? 에 가까이 가져가면 숨겨져 있든 describe화면이 나옵니다.
여기에 그림을 넣으면 아래처럼 그림을 분석해서 프롬프트를 제공해 줍니다. image Prompts에 넣으면 이미지를 참조해 그리고, Style References에 넣으면 스타일을 가져옵니다. 캐릭터나 사물을 따라 그리게 하고 싶을 때는 신기능! Omni-Reference 에 넣으면 됩니다.
앞에서도 말씀드렸지만, 그림을 분석한다고 해서 같은 그림이 나오는 건 아닙니다. 메타정보라고 부르는 그림을 설명하는 키워드만 사용하기 때문입니다. 프롬프트를 비교해 보시면 무엇을 우선하느냐에 따라 그림도 조금씩 달라집니다. 잘 섞으면 예쁜걸 만들 수 있겠죠? 간판에 글씨는 쓸 수 없으니 에디터에서 브러시로 선택하고 “clear”나 “blank”를 넣어서 지워주면 됩니다. 글씨는 포토샵이나 캔바에 맡기기로 하죠.
그림을 그릴 때는 니지를 써도 됩니다. 미드저니 요금을 내면 둘 다 사용할 수 있고 사용법은 거의 동일 합니다. https://nijijourney.com/imagine 으로 접속합니다. 미드저니 화면에서 프롬프트의 마지막 부분인 <--v 7>을 <--niji 6>로 넣으면 니지 서버를 호출해 그림을 제작합니다. 미드저니 서버에서 니지를 호출해 사용하셔도 되고, 니지로 접속해 사용해도 무방합니다. 차이는 니지는 한글을 쓸 수 있다는 점인데요. 최근에는 v7에서도 한글을 사용할 수 있습니다.
니지와 미드저니는 그리는 방식이 달라서 색과 스타일을 정하는 <--sref>등의 파라미터를 똑같이 써도 결과가 다르게 나타납니다. 서버를 오가며 원하는 스타일을 찾아보시면 좋겠죠?
여러 가지 방법으로 이미지를 만들어 보시니 어떠신가요? 그다지 어렵지 않습니다. AI 업체들은 서비스를 점점 더 쉽게 개선하고 있거든요. 화면 상단에 번개아이콘은 미드저니에서 챗GPT처럼 대화하며 이미지를 만들어나가는 서비스입니다. 말칸 아이콘은 음성인식으로 제작할 수 있는 서비스입니다. 최근 업데이트된 미드저니의 --oref 기능은 인물, 사진 속 제품의 구현율이 좋아진 상태입니다. 내년쯤 되면 사진의 영역에서라면 포토샵이 거의 필요 없어질지도 모르겠습니다.
그대로 사용하는 고수의 코드 자료,
프롬프트에 익숙해졌다면 내용을 보면서 어? 저 sref라는 건 어떻게 찾지? --profile 이라는 건 어떻게? 라고 생각하실 타이밍입니다. 가장 많은 코드를 수집할 수 있는 곳은 “미드저니 코리아 페이스북 그룹”의 조남경 그룹장님 게시글입니다. 매일 새 코드를 공개해 주고 계신데요. 이미 그룹에 공개한 코드만 천여 개가 넘으니 살펴보시면 좋겠죠? 책에 응용해서 사용하면 좋은 코드들을 소개해드립니다. 본문에 있는 프롬프트들도 따라서 써보시고 또 찾아서 써보시는 즐거움을 누리시면서 원하는 아름다운 그림을 만드실 수 있길 기원합니다.
(첨부 파일을 확인해주세요)