여름의 끝자락에서 8월의 사원을 소개할게요. 바로 AI 데이터 전문 기업을 이끌고 계신 테스트웍스의 윤석원 대표님입니다. 지난 6월에 김수민 작가님을 통해 알아본 생성형 AI 인터뷰를 읽으셨다면 AI 기술에 대한 관심이 많아졌을 거라 생각하는데요. 다양한 AI 기업을 조사하던 중 AI 기술을 통해 사회문제를 해결하고 있는 선한 기업이 있어 찾아가 보았습니다! 먼저 8월의 사원 책상부터 살펴볼까요?
경력단절 여성, 장애인 등 취업 취약계층을 적극 채용하시며 AI 기술로 더 나은 세상을 만드는 일을 누구보다 사랑하시는 대표님을 보며 많은 것을 느끼게 된 인터뷰였답니다. AI 데이터 시장과 기업 CEO의 경영철학까지 모두 담긴 인터뷰를 시작할게요!
안녕하세요, 대표님
간단한 인사 먼저 해주세요.
인공지능 전문 기업 테스트웍스 창업가이자 대표이사인 윤석원이라고 합니다.
반갑습니다.
창업 전에는 무슨 일을 해오셨나요?
저는 20년 정도 소프트웨어 엔지니어로 일했어요. 첫 직장은 실리콘밸리에 있는 스타트업을 거쳐 삼성전자와 마이크로소프트에서 근무한 뒤, 다시 삼성전자로 돌아가 창업 전까지 근무했습니다.
테스트웍스는
어떤 AI 전문 기업인가요?
AI 데이터와 검증 분야를 전문적으로 하는데요. 인공지능은 하나의 모델을 만들기 위해서 앞단에서 데이터의 설계부터 수집, 가공과 검증까지 잘 구축되어야 해요. 그 후에도 고품질의 데이터가 지속적으로 학습이 되어야 하죠. 아무리 큰 대기업이라도 이런 대규모 과정을 혼자 힘으로는 할 수 없어서 저희 같은 전문 기업이 필요합니다.
글로벌 대기업을 다니다 창업한 회사의 목적은
취업 취약계층의 일자리 제공이셨다고요?
네 맞아요. 다른 분들은 시장을 보고 경제적인 성과를 분석하며 시작하는 경우가 많은데 저는 그런 부분을 많이 보진 않았고요. 처음에는 사회에서 소외되시고 기회가 많이 주어지지 않은 분들에게 IT나 AI 분야에서 ‘어떻게 하면 이분들한테 적합한 직무를 설계하고 만들어서 지속 가능한 일자리를 만들 수 있을까’를 고민하다 창업하게 되었습니다.
실제로 직원의 28% 정도는 발달장애인, 청각장애인을 포함한 취업 취약계층이고요. 최근에 낸 베트남 지사도 직원 18명 중 14명 정도를 지체장애인으로 고용했어요.
장애인 직원분들의 업무 중
‘데이터 라벨링’이라는 작업도 있다고요.
네, 데이터 라벨링은 인공지능의 선생님이라고 이해하시면 되는데요. 인공지능 엔진한테 ‘이게 정답이야’라고 누군가는 선생님처럼 알려줘야 되거든요. 우리가 인식해야 되는 객체가 사람이다. 그 사람은 여성이다, 또는 아동이다. 이렇게 지속적으로 정답을 알려줘야 인공지능이 제대로 학습할 수 있어요.
라벨링은 많이 자동화됐기 때문에 사람, 차 등 이런 거는 99% 자동화되었지만 갑자기 새로운 객체가 등장할 수도 있죠. 예를 들면 프레시 매니저가 어느 날 새로운 카트를 몰고 있면 인공지능은 모르거든요. 그런 건 다시 데이터를 수집해서 그런 객체만 또 골라서 재학습을 또 시켜야 하죠.
장애인 채용 후 느낀 점이 있으신가요?
발달장애인분들은 반복적인 작업을 잘하시니까 디테일하고도 반복적인 작업을 굉장히 잘하시고 청각장애인분들은 아무래도 좀 소리 듣는 게 불편하시니까 비전 데이터 처리하시는 데 굉장히 강하세요. 베트남에 있는 지체장애인분들은 사실 IT나 AI 쪽에서 좀 몸이 불편한 게 키보드랑 마우스만 잘 쓸 줄 알면 장애가 아닌지라 저희 쪽에서 특별한 차이는 없는 것 같거든요.
오히려 전체적인 인사 관리 측면에서 이분들은 퇴사를 잘 안 하세요. 회사에 대한 로열티도 높으시고 근무 숙련도가 장기근속하면서 올라가시거든요. 그러니까 이제 오히려 고품질 데이터를 만드는 일에 강점을 많이 보여주세요.
또 우리 회사 장애인분들은 힘들면 힘든 티가 다 나거든요. 짜증 나면 소리 지르고요. 그렇게 앞과 뒤가 똑같아요. 얼굴에 다 드러나니까 오히려 예측 가능성이 좋아요. 리스크에 대해서 훨씬 더 사전적으로 관리가 가능한 면도 있습니다.
인공지능을 학습 시킬 다양한 데이터를
모으는 일도 하고 계시다고요?
네, 알바, 부업의 개념으로도 알려져 있듯 일반인 분도 참여해 데이터를 모아주시고 소정의 금액이나 봉사시간을 받아 가실 수 있는데요. 누구나 참여하실 수 있습니다.
우리 집 강아지 얼굴 사진부터 집 앞의 벤치 데이터도 모은 적이 있습니다. 유현준 교수님 영상에도 나온 적이 있는데 우리나라에 벤치가 없다고 하잖아요. 그러면 벤치가 실제로 얼마나 없는지 조사를 해야 되죠. 여러분들이 벤치를 찍어 올리시면 GPS 정보를 가지고 모으고 있어요. 처음에는 대기업이나 플랫폼 회사에 제안했지만 관심 보이는 곳이 없어서 저희가 자체적으로 시작했습니다.
또 진행했던 프로젝트 중에 미술관 음성 데이터를 수집한 적이 있어요. 미술관은 비장애인들만 간다고 생각하지만 시각장애인도 갈 수 있거든요. 그림이 안 보이거나 희미하게 보일 수 있지만 관람할 수 있죠. 저희가 수집한 데이터는 비장애인들이 그림을 보고 음성 데이터를 녹음하는 거예요. 각자 표현하는 게 다르겠지만 데이터를 모아서 랜덤하게 들려드리면 상상할 수 있잖아요. 반응도 되게 좋았고요. 이런 시도가 점점 늘어나면 시각장애인분들한테도 음성으로 설명해 줄 수 있는 제도나 AI로 학습을 시키는 등 서비스로 탄생할 수도 있겠죠.
대표님은 AI 기술을 통해
결국 사람에게 도움이 되는 일을 하시는 거네요.
인공지능 기술 자체가 반인류적인 기술일 수 있습니다. 첫 번째로 거대한 플랫폼을 가지고 있는 대기업 등 특정 업체가 데이터를 독점할 수 있고요. 챗GPT같은 서비스를 하려면 엄청난 양의 컴퓨팅 파워가 필요하거든요. 이런 서비스를 많이 쓸수록 지구 온난화가 심해질 수도 있어요. 각종 윤리적인 이슈도 있고요.
한편으로는 어떻게 설계할 거냐에 따라서 다양한 사회문제, 환경문제를 해결하는 데 활용할 가능성도 있거든요. 인공지능 기술을 결국 활용하는 건 사람이고 사회니까요. 그럴수록 우리 사회가 어떻게 인공지능을 제대로 활용하겠다는 철학과 방향이 있어야 되는 거죠.
생성형 AI가 등장하고
데이터 라벨링 시장도 변화가 있었나요?
변화 많죠. 아무래도 인공지능 산업이 전체적으로 커지니까요. 챗GPT같은 경우도 대규모 말뭉치들에 대한 라벨링이 필요해요. 문장, 단어 이런 걸 말뭉치라고 하는데 레이블링 되어있지 않은 데이터를 많이 모아둬야 하고, 그런 사업도 많이 하고 있어요. 그러나 이런 데이터를 고도화시켜서 학습을 시키거나 또는 강화 학습이라고 챗GP의 아웃풋이 굉장히 좋았는지 안 좋았는지를 평가하는 작업은 결국 또 수동으로 할 수밖에 없어서 앞으로 생성형 AI 때문에 데이터 라벨링 시장도 커질 걸로 보고 있어요.
어렵기만 한 AI를
저희는 어떻게 공부해야 할까요?
AI가 어떻게 동작하는지에 대한 이론과 간단한 실습을 통해서 어느 정도 원리를 이해하고 있는 건 좋을 것 같아요. 고도화된 인공지능 말고 단순하고 루틴한 업무를 자동화해 주는 초보적인 수준의 인공지능도 있거든요. 그런 것을 적용해 일의 시간도 줄이고 업무를 혁신하는 게 중요하다고 생각해요. 그래서 사람은 결국 좀 더 부가가치가 높은 일을 해야 한다고 생각해요.
하고 있는 일을 1~2년 이상 똑같이 반복하면 안 되고 혁신하는 연습을 들이는 건 중요한 거 같아요. 그래야 창의력이 생기죠. 그래서 동향을 파악하고 또 새로운 제품이 나오면 빨리 써보시고 이런 시도는 필요한 것 같아요.
동시에 비대면 중심으로 생활하는 게 익숙해졌고 저도 i 성향이 강한 사람인데요. 오히려 이런 시대에 관계를 가지려고 더욱 노력하는 것도 필요해요. 관계를 통해서 공감하고 소통해야 하죠. 앞으로 공감 능력이 중요해질 거거든요. 왜냐하면 공감을 통해서 상대방의 고민과 문제를 해결해 주고 더 나아가서는 사회의 문제를 해결해 줄 수 있으면 그 사이에서 리더가 자연스럽게 탄생하게 되거든요.
인터뷰를 마치며
대표님의 바람이 있으시다면?
회사를 잘 키우는 게 바람이죠. 좋은 일만 하는 기업이 아니라 가치와 철학이 확실한 기업이 경제적으로 잘 성장하고 지속 가능성을 보여준다는 걸 입증하는 게 제일 중요할 거 같아요. 미국이나 유럽 시장으로의 진출도 잘 돼서 그렇게 선한 영향력이 글로벌하게 퍼졌으면 좋겠습니다.
데이터 라벨링 시장에 대한 질문과 대표님에게 보내는 응원의 한마디는 👉 여기로 받고있어요!
이달의 사원을 추천하고 싶다면? 👉 여기에 남겨주세요!