본문 바로가기

Study/경제 신문 스크랩

[📰신문스크랩] [써보니]카카오브레인 B^ DISCOVER, 상업용 일러스트 시장 대체할 수 있을까

📰 기사 원문

[아시아경제 강나훔 기자] 'sunset, beach, couple' 단 세 개의 제시어를 입력하면 수초 안에 커플이 노을 진 해변을 거니는 그림을 만들어낸다. 사물의 질감이나 그림의 화풍까지 추가하면 마치 유명 화가가 그려낸 듯한 '작품'도 만들어낼 수 있다.

카카오브레인이 인공지능(AI) 기반 이미지 생성 및 공유 플랫폼 ‘B^ DISCOVER(B^디스커버)’을 공개했다. AI 아티스트 ‘칼로’를 활용해 만든 것으로, '칼로'는 그동안 카카오브레인이 공개한 'minDALL-E', 'RQ-Transformer' 등 초거대 이미지 생성 AI 모델을 발전시켜 만든 AI 아티스트다. 1억 2000만 장 규모의 텍스트-이미지 데이터셋을 학습해, 이해한 문맥을 바탕으로 다양한 화풍과 스타일로 이미지 생성을 할 수 있다.

모바일 환경 최적화…다른 사용자 이미지도 손쉽게 편집 가능

B^디스커버의 최대 장점이라면 직관적 인터페이스와 쉬운 사용 방법을 꼽을 수 있다. 별도의 가입 절차 없이 구글 계정으로 로그인하면 곧바로 애플리케이션을 이용할 수 있고, 모바일 환경에 최적화 돼 있어 이미지를 정사각형의 프레임 안에 보기 좋게 담아낸다.

처음 제시어를 입력하면 AI가 그려낸 6개의 이미지를 보여준다. 마음에 드는 이미지가 없다면 'generate more'를 클릭해 최대 14개까지 이미지를 얻을 수 있다.

무엇을 그릴지 떠올리지 못했다면, 가이드 기능이 이러한 고민을 덜어준다. 대상, 화풍, 장소, 색상 등 여러 개의 예시 제시어를 보여주는데, 이를 직접 고르거나 본인이 입력할 수 있다.

'Explore' 기능은 B^디스커버의 또 다른 볼거리다. 일종의 '갤러리' 기능으로, 다른 사용자들이 만든 이미지를 나열, 마치 온라인 전시회에 온 것과 같은 느낌도 불러일으킨다.

각 이미지에 해당하는 제시어를 볼 수 있어 새로운 이미지 생성 시 참고할 수 있고, 다른 사용자들이 만든 이미지의 제시어를 확인하고 이를 편집해 다른 새로운 이미지를 만들어낼 수도 있다. 만약 다른 사용자가 만든 'sunset, beach, couple'이라는 제시어에 'with child'라는 제시어를 추가한다면 커플이 아이와 손잡고 해변을 거니는 모습으로 재가공된다.

이들 이미지를 휴대폰에 저장하거나 카카오톡 등 다양한 소셜 앱으로 공유할 수도 있다.

내년 초 전문가용 버전 출시…창작 산업에 영향 클 듯

B^디스커버의 상업적 활용에 대한 관심도 높아지고 있다. 현재는 무료 버전이지만, 연내에 정식 버전을 글로벌 출시하겠다는 게 카카오브레인의 계획이다. 다만 구체적인 비즈니스모델(BM)에 대해서는 밝히지 않았다.

활용 분야는 다양하다. 가깝게는 B^디스커버에서 생성한 이미지를 인터넷상에서 자신을 표현하는 수단으로 활용할 수 있다. 자신을 형상화한 캐릭터나 그림을 만들어 내 이를 사회관계망서비스(SNS) 프로필 사진으로 활용할 수 있고, 얼굴 공개를 원치 않는 유튜버 등 인터넷 방송 진행자들은 초상권 침해 우려 없이 이미지를 활용할 수 있다.

웹소설이나 웹툰 등 창작 분야에서도 유용하게 활용될 것으로 보인다. 웹소설 작가들은 주인공 캐릭터, 배경, 표지 등 일러스트가 필요할 때가 많은데, 이때 B^디스커버를 활용한다면 비싸게 외주를 맡길 필요가 없어진다. 웹툰 작가들 역시 초기 콘셉트 설정이나 작화 등에서 도움을 받을 수 있다.

이와 관련 카카오브레인은 정식 버전에 이미지에서 불필요한 부분을 자연스럽게 제거하거나 편집할 수 있는 '이미지 인페인팅'(Image Inpainting), 기존 이미지를 보고 빛과 그림자, 주변 사물 등을 상상해 이미지를 확장할 수 있는 '이미지 아웃페인팅'(Image Outpainting) 기능 등을 추가한다는 계획이다. 예술가들의 창작 활동을 지원하는 전문가용 버전 또한 내년 초 공개할 예정이다.

카카오브레인 관계자는 "B^디스커버는 AI 기술을 창작 도구로 쓰면서 개인의 예술성을 극대화 인간의 창의성을 극대화하는 데 그 목적이 있다"라며 "앞으로도 사용자에게 새롭고 가치 있는 경험을 제공할 수 있도록 다양한 기능을 추가해 선보일 것"이라고 말했다.



👀 본문 요약

  • 인공지능(AI) 기반 이미지 생성 및 공유 플랫폼 ‘B^ DISCOVER(B^디스커버)’을 공개
    • 아티스트 ‘칼로’를 활용해 만든 것으로, '칼로'는 그동안 카카오브레인이 공개한 'minDALL-E', 'RQ-Transformer' 등 초거대 이미지 생성 AI 모델을 발전시켜 만든 AI 아티스트
    • 1억2000만장 규모의 텍스트-이미지 데이터셋을 학습해, 이해한 문맥을 바탕으로 다양한 화풍과 스타일로 이미지 생성

모바일 환경 최적화…다른 사용자 이미지도 손쉽게 편집 가능

  • B^디스커버의 최대 장점이라면 직관적 인터페이스와 쉬운 사용 방법
    • 별도의 가입 절차 없이 구글 계정으로 로그인하면 곧바로 애플리케이션을 이용
    • 모바일 환경에 최적화 돼 있어 이미지를 정사각형의 프레임 안에 보기좋게 담아낸다.
  • 처음 제시어를 입력하면 AI가 그려낸 6개의 이미지를 보여준다. 마음에 드는 이미지가 없다면 'generate more'를 클릭해 최대 14개까지 이미지를 얻을 수 있다.
  • 무엇을 그릴지 떠올리지 못했다면, 가이드 기능 → 대상, 화풍, 장소, 색상 등 여러 개의 예시 제시어를 보여주는데, 이를 직접 고르거나 본인이 입력
  • 'Explore' 기능은 B^디스커버의 또다른 볼거리: 일종의 '갤러리' 기능 → 다른 사용자들이 만든 이미지를 나열, 마치 온라인 전시회에 온 것과 같은 느낌
    • 각 이미지에 해당하는 제시어를 볼 수 있어 새로운 이미지 생성 시 참고할 수 있고, 다른 사용자들이 만든 이미지의 제시어를 확인하고 이를 편집해 다른 새로운 이미지
      • 만약 다른 사용자가 만든 'sunset, beach, couple'이라는 제시어에 'with child'라는 제시어를 추가한다면 커플이 아이와 손잡고 해변을 거니는 모습으로 재가공

내년 초 전문가용 버전 출시… 창작 산업에 영향 클 듯

  • B^디스커버의 상업적 활용에 대한 관심도 높아지고 있음
    • 현재는 무료 버전이지만, 연내에 정식 버전을 글로벌 출시하겠다는 게 카카오브레인의 계획

[활용 분야]

  • B^디스커버에서 생성한 이미지를 인터넷 상에서 자신을 표현하는 수단으로 활용
    • 자신을 형상화한 캐릭터나 그림을 만들어 내 이를 사회관계망서비스(SNS) 프로필 사진으로 활용
    • 얼굴 공개를 원치 않는 유튜버 등 인터넷 방송 진행자들은 초상권 침해 우려 없이 이미지를 활용
  • 웹소설이나 웹툰 등 창작 분야에서도 유용하게 활용
    • 웹소설 작가들은 주인공 캐릭터, 배경, 표지 등 일러스트가 필요할 때가 많은데, 이때 B^디스커버를 활용한다면 비싸게 외주를 맡길 필요가 X
    • 웹툰 작가들 역시 초기 콘셉트 설정이나 작화 등에서 도움
  • 카카오브레인은 정식 버전에 이미지에서 불필요한 부분을 자연스럽게 제거하거나 편집할 수 있는 '이미지 인페인팅'(Image Inpainting)
  • 기존 이미지를 보고 빛과 그림자, 주변 사물 등을 상상해 이미지를 확장할 수 있는 '이미지 아웃페인팅'(Image Outpainting) 기능 등을 추가
  • "B^디스커버는 AI 기술을 창작 도구로 쓰면서 개인의 예술성을 극대화 인간의 창의성을 극대화하는 데 그 목적이 있다"라며 "앞으로도 사용자에게 새롭고 가치 있는 경험을 제공할 수 있도록 다양한 기능을 추가해 선보일 것"
 

📑 추가 조사 내용

*️⃣ 카카오브레인, 창작하는 인공지능 선보여... 시·작곡·미술로 확장

시를 쓰는 AI '시를 쓰는 이유’

  • 카카오브레인이 개발한 한국어 특화 초거대 AI 언어 모델 KoGPT는 60억개의 매개변수(파라미터)와 2,000억개 토근(token)의 한국어 데이터를 바탕으로 구축
  • 한국어를 사전적, 문맥적으로 이해해 맥락에 따라 자동으로 글을 쓴다.
  • '시아'는 카카오브레인의 초거대 AI 언어 모델 KoGPT를 기반으로 시를 쓰는 AI 모델로, 1만 3천여 편의 시를 읽으며 작법을 익혔다. 주제어와 명령어를 입력하면 '시아'가 입력된 정보의 맥락을 이해하고 곧바로 시를 짓는다.
  • AI 기술을 활용해 기획된 시집 '시를 쓰는 이유'는 총 53편의 시로 구성돼있다. '시아'의 언어인 디지털 연산을 위한 기계어 0,1를 활용해 1부의 주제는 공(0), 2부의 주제는 일(1)로 선정했다. '영' 대신 '공'으로 표기한 것은 존재와 비존재, 의미와 무의미의 관계를 함께 담고자 하는 카카오브레인과 슬릿스코프의 의도가 담겨있다.
  • 공(0)은 슬릿스코프가 그동안의 작업 노트에서 나온 임의의 표현들을 시상으로 제시하여 생성된 시가, 의미/존재(on)의 뜻을 담고 있는 일(1)은 수학과 과학에 관한 주제를 시상으로 한 시가 수록됐다. 즉 1부는 '개인의 주관적인 부분'을, 2부는 '객관적인 대상이나 사실'을 시상으로 하여 시를 생성한 것이다.

삼성전자 X 카카오브레인 갤럭시 북 아트 프로젝트

  • 그림을 그리는 AI '칼로'도 선보였다. ‘칼로’는 그동안 카카오브레인이 공개한 'minDALL-E', 'RQ-Transformer' 등 초거대 이미지 생성 AI 모델을 발전시켜 하나의 페르소나로 재탄생한 AI 아티스트
  • 1.2억장 규모의 텍스트-이미지 데이터셋을 학습해, 이해한 문맥을 바탕으로 다양한 화풍과 스타일로 이미지를 생성
  • 삼성전자와의 협업은 칼로의 창의성과 예술성을 보여줄 수 있는 좋은 기회”였다며, “앞으로도 다양한 협업을 통해 무궁무진한 기회를 발굴해 나가며 칼로의 활용 영역의 지평을 지속 넓혀 나갈 계획이다”라고 밝혔다.
  • 개발하고 있는 모델이 북미, 유럽에서 제안하고 있는 세계 최고 수준의 모델과 비교했을 때 생성 능력이 더 좋아질 수 있도록 개선하는데 집중
  • "AI 칼로가 생성하는 그림이 윤리적인 문제가 발생하지 않도록 학습 데이터 정제 및 고도화에도 많은 노력을 하고 있고, 일례로 외부에 공개되어 있는 데이터셋을 활용하기 보다는 자체적으로 데이터 수집 및 정제 파이프라인을 구축하고 있고 1차 버전인 데이터셋 코요(Coyo)를 외부에 공개했다"

‘작곡하는 AI’

  • 밀리의 서재와 지니뮤직이 공동 제작한 오디오 드라마 ‘어서오세요, 휴남동 서점입니다’가 AI 기술을 적용하면서 관심을 끌었다. 이 오디오 드라마에는 총 19명의 출연진 중 8명의 배역을 AI 보이스가 연기했다. 특히 OST는 테이의 ‘같은 베개’를 AI가 편곡해 작품에 담아냈다.
  • “같은 인공지능 모델을 사용하더라도 어떻게 쓰느냐에 따라 활용 방안이 무궁무진 하다. 또 인공지능이 만들어 낸 창작물을 제작자 입장에서 보더라도 신기한, 흥미로운 결과물 들이 많다. 더 많은 대중들이 기술을 접하면서 아이디어가 나오면 기술의 활용처가 많이 발굴될 것”이라며 “AI의 창작물을 활용해 전문가가 아닌 일반 사용자분들도 본인의 생각을 표현하는데 제약이 많이 사라질 것 같아서 더 창의적인 콘텐츠가 많이 생산될 가능성도 높다”고 말했다.

카카오브레인은 한국에 본사를 둔 글로벌 AI 기술 연구개발(R&D) 기업으로, 2017년 라이프스타일을 변화시키는 AI 기술 기반의 솔루션을 개발해 '생각하지 못한 물음(Unthinkable Question)'에 도전하고자 설립


*️⃣ [초거대AI시대] 김광섭 카카오브레인 CTO "AI모델 경쟁 심화…1~2년內 놀라운 결과물 나올 것"

"지금까지는 AI 시장이 하드웨어, 인프라 위주로 성장을 해왔다면 앞으로는 서비스나 소프트웨어 중심으로 성장할 것"이라고 내다봤다.

김 CTO는 "이미지 텍스트, 이미지 멀티 모달 연구의 경우에는 텍스트를 입력했을 때 그에 적합한 이미지를 보여주기 때문에 '텍스트 to 이미지'라고 부르는데, 이러한 유사한 기법의 모델들이 주류를 이루고 있다"면서 "이러한 산업화 가능성이 높아 보이는 모델들의 경쟁이 굉장히 심화되고 있고, 나아가서 동영상 쪽으로 이어져서 1~2년 안에는 놀라운 결과물들이 나오지 않을까 생각한다"라고 전망했다.

최근의 AI 모델들과 기존 AI 모델들의 가장 큰 차이점으로 범용성과 창작 능력을 꼽았다. 그는 "어떤 문제를 푼다고 했을 때 과거엔 파인 튜닝(Fine-tuning)을 한다고 해도 그 큰 모델을 만드는 데 큰 비용이 들어갔지만 , 지금은 기본이 되는 거대한 모델을 재활용함으로써 여러 문제에 적용해 풀 수 있다는 게 가장 큰 장점"

AI 연구·개발에 있어 가장 중요한 키워드로 '실용성'을 꼽았다. 김 CTO는 "대부분의 빅테크사의 연구 성과물은 반쪽짜리"라며 "사실 논문과 실험 결과가 있더라도 이를 기업이나 개인, 기관들이 사용하려면 구현해 낼 수 있어야 하는데, 데이터를 모으는 것 자체가 비용이 많이 들고, 학습 과정에서 엄청나게 많은 인프라가 필요하다"라고 지적했다.

김 CTO의 이러한 문제의식은 어떻게 상업적으로 사용성을 넓힐 수 있을까라는 고민으로 이어졌다. 카카오브레인의 '헬스케어' 분야 진출은 이러한 고민의 산물

김 CTO는 "영상 의학과 의사분들이 X-ray 이미지를 본 다음에 병변이 있거나 의심스러운 부분이 있으면 판독문을 써주는데, 요즘 시대 AI는 텍스트를 써주면 이미지를 만들 수 있다. 거꾸로 생각해보면 이미지가 있으면 AI가 텍스트를 쓸 수 있다는 얘기"라며 "영상의학과 전문의가 전 세계적으로 부족한 상황에서 의사들이 이미지를 보고 판독문을 쓰는 시간이 현격히 줄어들어 큰 도움이 될 것"이라고 했다.

그는 "신약 개발 쪽으로도 노력을 기울이고 있다. AI 기반 신약개발 업체 갤럭스와 함께 연구를 진행 중"이라며 "만병통치약을 만들겠다는 것은 아니고, 신약 개발에 걸리는 긴 시간을 단축시키는 것이 목표다.

 

👩🏻‍💼 현직자 질문 + 내 생각 + 적용할 점

📌 인사이트

  • AI가 직접 창작하는 시대가 왔다 → 실제로 사용해보니 재미있다
    • 실질적으로 나의 이미지를 토대로 화풍을 적용할 수 있으면 활용도가 높을듯
    • NFT로 발행하려는 사람의 수요
  • 카카오브레인, AI를 통한 예술 플랫폼 외에도 의료 플랫폼 등 확장 범위가 높다

Q. AI 기반으로 어떤 디자인을 주로 진행하는지, 그 범위와 카테고리는?