Meet Superb AI’s R&D team

Meet Superb AI’s R&D team

1) Meet Superb AI’s R&D team

Superb AI Engineer가 일하는 법

들어가며

Superb AI는 2022년에도 성장을 멈추지 않기 위해 수많은 도전을 해왔습니다. 구성원 수 또한 해마다 2배씩 성장하며, 현재는 약 100명의 글로벌 직원들이 Superb AI와 함께하고 있는데요. 앞으로 이 시리즈에서는 어떻게 이 많은 구성원들이 한 마음 한 뜻으로 모든 기업이 쉽게 인공지능 기술을 개발하고 활용할 수 있는 서비스를 만들기 위해 노력하고 있는지 공유해보려고 합니다. 첫 번째로 소개할 조직은 Superb AI에서 없어서는 안 될, 아주 중요한 우리의 서비스를 만들어주고 있는 Superb AI의 R&D팀을 소개합니다!

Superb AI의 Engineer는 어떻게 일하나요?

  • 전문성과 오너십을 바탕으로 한 Squad 문화

Superb AI의 Engineer는 R&D(Research&Development) 조직에서 일하게 됩니다. Superb AI의 R&D 조직은 Product Owner, Front/Backend Engineer, DevOps Engineer, Product Designer 등으로 구성되어 있는데요. 각 분야의 담당자가 하나의 Squad로 모여 일하고 있습니다.

각 Squad는 Superb AI의 대표 머신러닝 데이터 플랫폼 Suite(스위트)라는 하나의 서비스 아래, 유기적으로 연결된 공동체 조직입니다. 현재 R&D 조직의 Squad는 Annotation App, DataOps, Analytics, Suite Labeling, Suite Enablement, Machine Learning, Sensor Fusion, Solution Engineering, Growth Engineering과 같이 9개로 나뉘어 있습니다.

각 Squad는 효율적인 타임라인을 작성하고, 각 프로젝트 별로 전문성을 바탕으로 비즈니스 방향성과 유저 니즈를 고려하여 도메인 별로 로드맵 작성합니다. 또한 보다 효율적인 프로덕트의 목표와 전략을 수립하기 위해 함께 노력하고 있습니다.

Superb AI Engineer는 인공지능 기술을 활용한 효과적인 학습용 데이터 구축 및 관리 툴인 Suite(스위트)를 만들고 있는데요. 명확한 목표를 가진 Squad에서 팀원들은 본인이 만드는 프로덕트에 대한 오너십을 더 확실하게 가져갈 수 있고 bottom-up 방향으로 다양한 의견을 제시할 수 있는 환경을 바탕으로 주도적인 개발을 진행합니다. 또한 프로덕트 개발뿐만 아니라 DevOps 환경을 개선하며 Superb AI Engineer를 위한 효율적인 개발 문화를 함께 고민하며 만들어 나가고 있습니다.

Superb AI 창립 이래 쉬지 않고 진행되고 있는 2주 단위의 Sprint 🏃

  • Agile, Lean, and Iterative한 개발 문화, Sprint

창립 이후 4년이 넘는 시간 동안 진행된 Sprint는 벌써 100회가 넘었습니다. 각 Squad는 2주 단위의 Sprint를 개별적으로 진행합니다. Sprint가 시작되는 월요일에 플래닝을 하고, 비즈니스 방향성 및 고객 니즈를 기반으로 한 백로그 중에 단기간 내 집중하여 실제 배포 가능한 건에 대해 우선순위를 정리하여 개발합니다. 2주 뒤, Sprint 가 끝나는 금요일에는 회고를 진행하여 진행했던 Sprint에 대한 피드백을 주고받는 시간을 가집니다. 투명한 소통(Be Honest & Transparent)을 Core value로 하는 Superb AI 인 만큼, 매 Sprint 마다 활발한 아이데이션을 통해 더 좋은 프로덕트를 만들기 위해 노력하고 있습니다.

2022년 여름, Sprint 100회 기념 축하파티🎉

  • 수평적이지만 서로를 존중하는 문화, 개인의 역량을 성장시킬 수 있는 환경

Superb AI는 연차에 상관없이 개인의 역량을 바탕으로 한 수평적인 평가를 바탕으로 하고 자기 계발 및 발전에 있어 확실한 성장환경을 지원합니다. 그리고 본인의 성장뿐만 아니라 더 나아가 팀 전체, 즉 동료의 성장을 위해서도 서로 간 다양한 활동을 하게 되는데요. 새로운 분야에 온보딩 할 때 항상 페어 프로그래밍을 진행하거나 개발 내용에 대한 세미나를 진행하는 등, 다양한 활동을 진행하게 됩니다. 그 외에도 다양한 기술 스택, programming language, framework 등 보다 트렌디한 개발 문화를 경험할 수 있고 보너스로 AI 업계의 도메인 지식까지 챙기며 개인의 업무 scope을 넓게 가져갈 수 있는 부분이 Superb R&D Team의 장점입니다.

Frontend, Design 워크샵✌ 각 팀, Squad마다 다양한 워크샵이 활발하게 진행되고 있습니다!

2) CTO Interview

CTO가 직접 소개해 주는 Suite 이야기

  • 자기소개 부탁 드립니다. :)

Superb AI Co-Founder 이자, CTO 역할을 맡고 있는 이정권입니다. 반갑습니다!

  • 당신은 어떤 일을 하는 Superb 인가요?

저는 저희 Superb AI의 핵심기술인 Suite(스위트)를 비즈니스로 어떻게 연결해야 할지 방향성을 고민하고 어떻게 하면 더 잘만들 수 있을지 고민하는 최고 기술 책임자 CTO 입니다.

  • Superb AI에 대해 소개 부탁 드립니다.

저희 Superb AI는 머신러닝이 지니고 있는 데이터 문제를 해결해서 AI 개발의 진입 장벽을 낮추고, 누구나 쉽게 AI 개발을 할 수 있도록 돕는 플랫폼인 Suite(스위트)를 만드는 기업입니다.

저희는 Suite(스위트)를 대표적인 서비스로서 제공하고 있고, 저희만이 가지고 있는 핵심 기술인 오토 라벨링(Auto-Labeling)으로 10건의 미국 특허기술을 보유하고 있습니다.

지금 전 세계 4,300개 이상의 팀이 Suite(스위트)를 사용 중이고, 자율주행이나 CCTV, 사람 행동인식, 항공위성, 의료, 모바일 AI 등에 아주 다양한 9,000개가 넘는 데이터 구축 프로젝트나 데이터 관리 프로젝트가 Suite(스위트)에서 이루어져 왔습니다. 이는 데이터 수로만 보면 5천만 건 이상, 라벨링 수로는 1.3억 건 이상으로 MLOps 플랫폼 분야에서 Superb AI가 얼마나 영향력 있게 성장해왔는지 알 수 있는 부분이라고 생각합니다. (2022년 9월 업데이트)

  • Suite(스위트)는 어떤 서비스인가요?

인공지능 개발을 위해서 어떤 일이 필요한지 알아야 하는데요, 머신러닝 개발을 위해서는 기본적으로 아주 많은 데이터의 확보와 정리가 필요합니다. 사진 한 장에 대해서도 이것을 바탕으로 AI를 학습시키고 싶다면, 사진 하나에 있는 정보를 컴퓨터에게 인식시키고 사람이 가공하는 작업이 필요한데요. 가공된 데이터로 모델을 만들어야 될 때는 반복적인 모델 실험, 그리고 실험을 통해 찾아낸 결함을 보충하기 위한 새로운 데이터 구축 과정이 반복적으로 이루어지게 됩니다. Suite(스위트)는 이렇게 데이터 라벨링 작업은 물론, 데이터를 가지고 할 수 있는 인공지능 개발 전체에 대한 프로세스를 효율화하기 위한 플랫폼입니다.

  • Suite(스위트)로 무슨일을 할수있나요?

Suite(스위트)는 특히 데이터 중에서도 컴퓨터 비전(Computer Vision)에 관련된 데이터에 특화된 플랫폼입니다.

딥러닝이 발전하면서 특히 컴퓨터 비전(Computer Vision) 기술의 가능성이 굉장히 크게 열리고 있는데요. 컴퓨터 비전(Computer Vision) 기술을 활용하려면 특히 다른 데이터 보다도 데이터의 가공 과정이 굉장히 중요합니다. 이미지나 비디오, 포인트 클라우드와 같이 컴퓨터 비전(Computer Vision)에 다루는 데이터에 딥러닝을 위해서 필요한 정보를 확인하고 가공하고 쌓아서 분류하는 작업을 일반적으로 데이터 라벨링이라고 부르는데요. Suite(스위트)는 기본적으로 이러한 라벨링 작업을 더 편리하게 수행하고 자동화할 수 있게 도와줍니다. 그리고 데이터 라벨링 이후에 반복적으로 일어나는 데이터에 관련된 워크플로우를 효율적으로 운영할 수 있도록 하고, 또 그에 이어지는 머신러닝 모델 개발과 관련된 일들을 도와주기도 합니다.

  • Suite(스위트)를 개발하시면서 어떤 점을 가장 고민하셨나요?

여러 고민이 많긴 했는데요. 사실 제일 중요하다고 생각하는 부분은 점은 기술이 계속 발전하고 있다는 점입니다. 저희가 접하게 되는 환경은 AI로 하여금 해결하기를 바라는 문제가 점점 더 복잡해지고 다양해지고 있다는 점입니다. Suite(스위트)가 기능 측면에서 잘 따라가도록 하는 것도 중요하지만. 개인적으로 중요하다고 생각하는 점은 Suite(스위트)를 사용하는 고객들이 다양하게 발전하고 있는 AI 기능들을 마치 플레이그라운드, 놀이터처럼 자유롭게 쓰면 좋겠다는 생각으로 개발을 하고 있습니다.

예를 들면 엔지니어들이 데이터 작업을 하게 된다고 하면, 사실 결국 데이터를 가지고 만드는 최종적인 모델 말고도, 그 데이터를 분석하고 데이터를 효과적으로 활용하기 위한 제3의 AI 기능들이 필요하게 되는데요. 저희는 이런 엔지니어들이 제3의 작업에 공을 들이지 않고도 Suite(스위트)를 통해서 그들이 생각하고 있는 에이아이 기능들을 편리하게 테스트해볼 수 있도록 하고, 위험부담을 가지지 않고 최소한의 비용으로, 그들이 생각하고 상상할 수 있는 데이터 관련된 워크플로우를 구축하고 싶었습니다.

기업들이 직접 데이터를 위한 AI 기술들을 개발하고 사용하는 것은 생각보다 매우 어려운 일이고, 전 세계적으로 기업들은 데이터 문제를 효과적으로 해결하기 위한 솔루션을 고민하고 있는데요. 저는 이런 가려운 부분을 저희 Suite(스위트)가 속 시원하게 긁어 줄 수 있었으면 하는 바람을 가지고 있고요.

  • 누구나 쉽게 사용 가능한 Suite(스위트)

특히 컴퓨터 비전 데이터는 눈으로 인지를 하는 것이기 때문에 굉장히 다양한 사람들이 참여하는 프로젝트가 됩니다. 프로젝트를 관리하는 사람의 모델을 만들고 모델을 실험하는 사람뿐만 아니라 데이터를 라벨링 하는 그런 가공 작업자나, 라벨링이 잘 이루어졌는지 확인하는 검수 작업자 등 굉장히 다양한 페르소나를 가진 사람들이 이런 데이터 프로젝트에 투입되게 됩니다. 저희 Suite(스위트)는 이런 다양한 특성을 가지고 다양한 이해도를 가진 사람들이 같은 목적을 가지고 일할 수 있도록 UX나 심미성, 사용감에 많은 투자를 하고 있는 편입니다.

단순히 데이터를 구축하는 환경을 제공하는데 그치지 않고 계속 최신 연구를 수행하고 있는데요. 저희가 가지고 있는 자체 기술인 Uncertainty Estimation이나 및 Mislabel Detection 같이 데이터 분야의 특유의 존재하고 일반적으로는 풀고는 싶지만 그렇다고 내가 풀기에는 투자하기 좀 아까운 그런 분야에서 한 발짝 더 나아가기 위해서 기술에 많은 투자를 하고 있습니다.

  • Suite(스위트)의 오토라벨링은 실제로 데이터 작업 속도를 줄여주나요?

어떤 작업을 하느냐에 따라서, 또 저희가 그런 데이터와 얼마나 비슷한 문제를 많이 풀어봤느냐에 따라서 그 결과가 많이 달라지기는 하는데, Suite(스위트)에서 저희가 제공하는 커스텀 오토 라벨링 기술을 사용하면 적어도 평균적으로 다섯 배에서 여섯 배 정도 데이터 라벨링 작업 속도가 향상되는 걸로 알고 있습니다. Suite(스위트)의 오토 라벨링 기술은 현재 컴퓨터 비전 분야에 관련해서는 당장 생각이 나는 방법 안에서 라벨링 작업 자동화를 할 수 있는 최적의 환경을 제공하고 있는데요. 만약 Suite(스위트)에서 제공하는 오토 라벨링으로 그 데이터 작업 속도를 쉽게 부스트 할 수 없는 프로젝트라고 하면, 다른 기술을 간단히 가져와서는 여전히 쉽지 않은 문제라고 생각할 수 있을 것 같습니다.

  • 그 외에 Suite(스위트)의 더 다양한 기능을 소개시켜 주신다면?

Suite(스위트)에는 오토 라벨링뿐만 아니라 다양한 AI 기술이 적용되어 있습니다. 특히 효과적인 데이터셋의 구축, 양질의 데이터 확보라는 관점에서는 데이터 하나하나의 작업 속도 못지않게, 내가 가진 데이터 중 어떤 것이 잘못되었는지 파악하고, 수많은 데이터 중 어떤 데이터가 더 가치가 있는지 선별하여 전체 구축 과정을 효율화하는 과정 또한 중요합니다.

이를 데이터 큐레이션(Curation) 작업이라고 부르는데, 이 또한 라벨링 작업만큼이나 많은 리소스를 소모하는 작업입니다. Suite(스위트)에서는 이러한 문제를 돕는 AI 기능인 mislabel detection과 embedding store 기술을 오토 라벨링과 마찬가지로 별도의 작업 없이 사용하실 수 있게 제공하고 있습니다. 아직 오토 라벨링만큼 성숙한 기술은 아니지만, 피드백을 통해 꾸준히 발전시켜 나가고 있습니다. (2022년 9월 업데이트)

  • 나에게 Superb AI는?

저에게 Superb AI는 어떤 데이터 관리에 필요한 AI 기술들을 이것저것 실험해볼 수 있는 놀이터, 혹은 플레이그라운드라고 생각합니다! 또 전문적인 연구자 같은 사람이 아니어도 이제 눈이 달린 컴퓨터, 컴퓨터 비전 데이터 같은 것을 가지고 어떤 일을 우리가 할 수 있을지에 대한 아이디어가 계속해서 쏟아져 나올 수 있는 그런 시기라고 생각합니다.

저희 Superb AI의 Suite(스위트)는 이렇게 데이터 구축, 관리 같은 전 분야에서 누구나 쉽게 생각을 실험하고, 또 사용하고 그 효과를 누릴 수 있는 플레이그라운드 역할을 하고 싶습니다.

>>MLOps Insight 뉴스레터 구독하기

*아직 Superb AI의 콘텐츠를 받아본 적이 없으신 분들은 MLOps Insight 구독을 통해 최신호를 받아보실 수 있습니다. (MLOps Insight는 데이터 중심적(Data-centric) 관점에서 MLOps에 대한 최신 소식을 더 쉽게 찾을 수 있도록 돕기 위해 만들어진 뉴스레터입니다.)