본문영역

데이터 활용
생태계 구축으로
새로운 데이터
스토리 문화를 선도하다

UNIST Start-up
㈜코어닷투데이

4차 산업혁명의 가장 큰 변화는 초연결과 초지능, 경계가 없는 융합이다. 그 근간에 데이터가 있다. AI와 함께 데이터를 다루는 역량은 초연결사회에서 필수 능력으로 꼽힌다.
이 같은 흐름을 먼저 포착해 데이터 활용을 위한 선순환 생태계를 구축하고 새로운 데이터 문화를 만들어나가겠다는 원대한 비전을 제시한 스타트업이 있다. 우리나라 최고의 AI 기반 데이터 가공 전문기업으로 인정받는 ㈜코어닷투데이다.
  • 글. 편집실   사진. 김범기

“저희는 인공지능을 이론으로 아는 데
그치지 않고 누구나 원천 데이터나 가공 데이터를
분석할 수 있는 공간과 도구, 공유 환경을 제공하는
‘데이터 스토리텔링 플랫폼’을 만들고자 합니다.
이 플랫폼이 신뢰할 수 있는 데이터 기반의
스토리를 자연스럽게 탐색해 정보를 습득하는
구독자와 데이터를 분석해 스토리를 만들어내는
데이터 크리에이터와의 접점으로 기능하고
서로 선순환할 수 있는 데이터 생태계로
성장할 수 있기를 바랍니다.”

“저희는 인공지능을 이론으로 아는 데
그치지 않고 누구나 원천 데이터나 가공
데이터를 분석할 수 있는 공간과 도구,
공유 환경을 제공하는 ‘데이터 스토리텔링 플랫폼’을 만들고자 합니다.
이 플랫폼이 신뢰할 수 있는 데이터 기반의 스토리를 자연스럽게 탐색해 정보를
습득하는 구독자와 데이터를 분석해
스토리를 만들어내는
데이터 크리에이터와의 접점으로 기능하고 서로 선순환할 수 있는 데이터 생태계로
성장할 수 있기를 바랍니다.”

다양한 분야의 AI 기반 데이터 모델을 개발하다

아날로그 시대에 토지와 노동, 자본 등의 유형자산이 중요했다면, 디지털시대에는 데이터나 알고리즘 같은 무형의 사이버 자산이 그 위치를 차지한다. 앞으로 이 사이버 자산을 얼마나 잘 이해하고 다루느냐가 핵심 경쟁력인데, 그 근간에 인공지능이 있다. ‘앞으로 인공지능과 얼마나 잘 협력하느냐가 연봉을 결정할 것’이라는 미래학자들의 말이 곧 피부에 와닿을 것이다. 그런데 인공지능에 관한 이론만 배우다 끝나는 경우가 허다하고, 정작 어디에 어떻게 활용해야 하는지 방향을 잡기 어려워 하는 이들이 많다. ㈜코어닷투데이는 이에 대한 길라잡이 역할을 자처한다.
코어닷투데이는 원천 데이터를 가공하고 분석해 필요한 목적에 부합하는 다양한 데이터 모델을 제공하는 전문기업이다. UNIST 수리과학과 장봉수 교수가 2016년 교원창업기업으로 설립했으며, 현재는 당시 함께 했던 김경훈 박사후 연구원이 대표를 맡고 있다.
이곳은 창업 초기에 한국어 뉴스를 요약하는 자연어처리 기술 개발에 주력했다. 컴퓨터와 인간 언어 사이의 상호작용을 다루는 자연어처리는 인공지능의 핵심 기능 중 하나다. 지금도 방대한 텍스트로부터 의미 있는 정보를 추출하고 활용하기 위해 딥러닝과 딥러닝 기반의 자연어처리 기술 연구가 활발히 진행 중이다. 코어닷투데이는 초창기부터 수많은 알고리즘 연구 개발을 이어왔으며, 그렇게 쌓은 기술력이 오늘날 코어닷투데이를 뒷받침하는 든든한 바탕이 됐다.
길지 않은 업력에도 불구하고, 그간 코어닷투데이가 걸어온 행보는 예사롭지 않다. 2018년에 법률 판례 검색을 최적화한 검색엔진인 ‘로:봇(LAWBOT)’ 서비스 구축으로 화제를 모았다. 로:봇은 공공데이터 중 판례 데이터를 추출해 가공, 분석하는 검색엔진으로 단어가 아닌 의미 중심으로 법률을 검색하고 시각화 엔진을 통해 판례 간 관계성을 쉽게 파악할 수 있어 큰 호응을 얻었다. 탄탄한 기술력을 바탕으로 2019년 과학기술정보통신부에서 주관하는 데이터바우처 공급기업으로 선정됐으며, 지난해에는 대기업이 과제를 제시하고 스타트업이 해결하는 ‘대스타 해결사 플랫폼 1탄’ 공모전에 참가해 KBS에서 제시한 ‘인공지능을 활용한 시청률 예측 방법’의 해결사로 최종 선정됐다. 이때 코어닷투데이는 시놉시스를 통해 장르를 도출하고 배역별 캐릭터를 분석해 후보 배우별 드라마 시청률을 예측하는 알고리즘을 제안했다. 드라마 제작과 관련한 내부 정보까지 포함해 AI 학습을 하면, 드라마 성과 예측의 정확성을 높이고 사전 기획 단계에서 배우를 결정하는데 도움을 줄수 있다는 점을 인정받았다.

구독자와 크리에이터가 선순환하는 데이터 생태계를 향하여

코어닷투데이의 행보 중에 눈에 띄는 것은 인재 양성을 위한 노력이다. 김경훈 대표는 특히 데이터 스토리를 생산하는 데이터 크리에이터 양성에 주력하고 있다. “수많은 데이터가 혼재하는 가운데서 하나의 메시지를 분명하게 전달할 수 있는 콘텐츠가 필요한데요, 이 콘텐츠를 만드는 사람이 데이터 크리에이터입니다. 유튜브 크리에이터처럼 각자의 기술과 지식, 아이디어를 다채롭게 활용해 구독자가 즐길 수 있는 콘텐츠를 만들어내는 거죠. 저희는 이 콘텐츠를 데이터 스토리로 명명합니다.” 코어닷투데이는 현재 울산정보산업진흥원(UIPA)과 MOU를 맺고 ‘AI배울랑교 데이터 크리에이터 양성과정’을 운영 중이다. 교육은 데이터를 하나의 스토리로 만들기 위한 파이썬 기초교육부터 인공지능 심화 과정까지, 데이터 활용을 다양하게 경험할 수 있는 실무 중심으로 진행된다. 현재 코어닷투데이에서 데이터 크리에이터로 일하고 있는 김도희 사원, 데이터 엔지니어로 재직 중인 안국문 사원 역시 배울랑교를 통해 인공지능과 데이터에 관한 교육을 수료한 인재들이다.
김 대표는 “텍스트, 이미지, 시계열 등의 데이터를 활용해 다양한 분야에서 모델을 개발하고, 데이터 크리에이터를 양성하는 것은 인공지능 활용 예를 만들고 이를 위한 알고리즘을 모두 함께 공유하고 싶은 목표를 향해 디딤돌을 하나씩 놓은 과정”이라고 말한다. 즉 지금의 데이터 가공 기술을 API(Application Programming Interface)로 개발하고 이를 쉽게 쓸 수 있는 파이썬 라이브러리를 만들어 누구나 활용할 수 있도록 오픈하겠다는 것이다. 이미 일부 소프트웨어는 오픈소스로 공개했다. 금융 데이터를 다루는 데이터 도구인 ‘코어닷파이낸스’가 대표 사례다. 더불어 많은 데이터 크리에이터가 편하게 활용할 수 있도록 현재 개발 중이거나 앞으로 개발할 텍스트, 이미지, 시계열 관련 기능도 올 하반기에 정식 론칭할 ‘코어닷투데이 오픈소스저장소(https://github.com/coredottoday)’를 통해 공개할 예정이다.
또 김 대표는 “저희는 인공지능을 이론으로 아는 데 그치지 않고 누구나 원천 데이터나 가공 데이터를 분석할 수 있는 공간과 도구, 공유 환경을 제공하는 ‘데이터 스토리텔링 플랫폼’을 만들고자 합니다. 이 플랫폼이 신뢰할 수 있는 데이터 기반의 스토리를 자연스럽게 탐색하고 정보를 습득하는 구독자와 데이터를 분석해 스토리를 만들어내는 데이터 크리에이터와의 접점으로 기능하고 서로 선순환할 수 있는 데이터 생태계로 성장할 수 있기를 바랍니다.”라고 코어닷투데이의 비전을 밝혔다. ‘데이터를, 메시지를 담은 스토리로 말한다’라는 비전을 제시하고 새로운 데이터 문화를 만드는 선두에 서 있는 코어닷투데이가 만들어나갈 AI 기반의 데이터 스토리텔링이 거대한 숲을 이루는 날이 머지않은 듯하다.

MINI INTERVIEW
  • 주도적으로 일하며 스스로 성장하는 공간 김도희 데이터 크리에이터 UNIST 컴퓨터공학과4학년 휴학

    “군대를 제대한 후, 자신의 목표를 정확히 알고 전진하는 친구들을 보면서, 다양한 일을 경험하며 나의 길을 찾아야겠다고 생각했습니다. 그러다 지난해 겨울방학에 2개월간의 산학 연계 교육프로그램(CUop)을 통해 ‘KBS 드라마 흥행 관련 인공지능 모델 개발’에 참여한 것을 계기로 휴학하고 코어닷투데이에서 일하게 됐습니다. 제가 관심 있는 스포츠와 게임 분야의 데이터를 수집해 다양한 데이터 스토리를 만드는 게 재밌고 즐거웠어요. 지금은 드라마 흥행 예측을 위한 데이터 수집과 분석, 신경망 모델을 구축하고 있는데요, 단순히 드라마 흥행 예측을 위해서가 아니라 자연어처리 과정을 API로 만들어 오픈소스로 공개하고 이를 많은 데이터 크리에이터가 활용할 수 있도록 하려고 합니다. 기획 단계부터 구현까지 스스로 고민하고 주도적으로 일하면서, 더 나은 데이터 크리에이터로 성장할 수 있어 만족스럽습니다.”

  • 7년을 돌아 찾은 길, 전공과 달라도 재밌게 일해요 안국문 데이터 엔지니어 unist 친환경에너지공학부 졸업

    “이곳에 오기 전에 기업에서 7년 남짓 목표를 세우고 평가하는 지표를 만들어 성과를 관리하는 일을 했습니다. 그런데 새로운 방식을 시도하기보다 해마다 반복되는 일이라 그다지 재미가 없더라고요. 그러다 우연히 대표님과 인연이 닿아 배울랑교를 160시간 이수하고 입사했어요. 이후에 여러 인공지능 개발 실무를 배우고 지금은 울산시에서 지원하는 신기술 R&D 사업을 통해 ‘인공지능 화가’를 개발 중입니다. 원본 이미지의 기본 형태를 유지하되, 인공지능 알고리즘을 활용해 원하는 스타일의 화풍을 적용해 새로운 이미지를 만드는 것인데요, 대중이 인공지능과 예술을 쉽게 접하고 즐길 수 있도록 하는 게 목표죠. 올 하반기에 관련 전시회를 개최할 계획입니다. 지금 하는 일이 대학에서 배운 전공과는 달라도 정말 재밌게 일하고 있습니다. 데이터로 가치 있는 스토리를 만드는 일이 의미 있고 앞으로 더 성장할 수 있다고 생각합니다.”